Human Activity Recognition Using Smartphones Sensor DataSet
收藏github2024-05-16 更新2024-05-31 收录
下载链接:
https://github.com/MadhavShashi/Human-Activity-Recognition-Using-Smartphones-Sensor-DataSet
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于人类活动识别,通过智能手机传感器记录的数据来预测人的运动。数据集详细描述了数据记录方式、预处理方法以及数据目录等。
This dataset is designed for human activity recognition, utilizing data recorded from smartphone sensors to predict human movements. The dataset provides detailed descriptions of the data recording methods, preprocessing techniques, and the data directory structure.
创建时间:
2020-08-24
原始信息汇总
数据集概述
数据集名称
- Human Activity Recognition Using Smartphones Sensor DataSet
数据集来源
- 数据集来自UCI数据集仓库,收集自30名参与者在进行日常活动时携带的智能手机中的传感器数据。
数据收集方法
- 参与者腰部携带智能手机,手机配置记录了内置的加速度计和陀螺仪传感器数据。数据通过2.56秒固定宽度的滑动窗口进行采集,窗口间有50%的重叠,导致数据点等距(1.28秒)。
数据预处理
- 传感器信号经过噪声过滤,并以2.56秒的固定宽度窗口进行采样,每个窗口包含128个读数。从每个窗口中,通过计算时间域和频率域的变量来获得特征向量。
数据特征
- 数据包括从加速度计和陀螺仪捕获的3轴线性加速度和3轴角速度,以及其他衍生信号如身体加速度、重力加速度、身体加速度的急动信号等。
- 特征包括均值、标准差、中位数绝对偏差、最大值、最小值等统计量。
标签编码
- 活动标签从1到6编码,对应于Walking, Walking_Upstairs, Walking_Downstairs, Sitting, Standing, Laying。
数据目录结构
- 数据集提供为一个约58MB的zip文件,包含训练和测试数据。
训练与测试数据比例
- 数据随机分为70%的训练数据和30%的测试数据。
数据集用途
- 用于构建预测人类活动的模型,如行走、上楼、下楼、坐、站、躺等。
数据集问题类型
- 这是一个多类分类问题,涉及预测基于传感器数据的人类活动。
最佳性能指标
- 使用准确度、混淆矩阵和多类对数损失作为性能评估指标。
业务目标和约束
- 软件可转化为智能手机应用,帮助用户监控健康活动。
- 错误分类的成本可能很高,但无严格延迟要求。
技术方面
- 数据集适用于经典机器学习和深度学习模型,用于预测人类活动。
搜集汇总
数据集介绍

构建方式
该数据集通过30名参与者在日常生活中佩戴腰部智能手机的方式进行构建。智能手机内置的加速度计和陀螺仪传感器记录了参与者的三轴线性加速度和三轴角速度。数据通过固定宽度的滑动窗口(2.56秒,50%重叠)进行采样,每个窗口包含128个读数。实验通过视频记录并手动标注数据,确保了数据的准确性。
特点
该数据集具有多维度的特征,包括时间域和频率域的信号。通过应用噪声滤波器和快速傅里叶变换(FFT),数据被预处理为多个特征向量,如平均值、标准差、能量等。这些特征不仅涵盖了加速度和角速度的基本信息,还通过计算欧几里得范数和频域信号,提供了更丰富的运动信息。
使用方法
数据集可用于多种机器学习和深度学习模型的训练与测试。用户可以选择使用预处理后的特征数据进行经典机器学习模型的训练,如逻辑回归、支持向量机等;也可以使用原始传感器数据进行深度学习模型的训练,如卷积神经网络(CNN)或循环神经网络(RNN)。数据集的训练和测试数据按70%和30%的比例划分,确保了模型的泛化能力。
背景与挑战
背景概述
随着智能手机在日常生活中的普及,基于智能手机传感器的活动识别(Human Activity Recognition, HAR)研究逐渐成为热点。该数据集由30名参与者在腰部佩戴智能手机的情况下进行日常活动时收集,利用手机内置的加速度计和陀螺仪传感器记录数据。该实验通过视频记录手动标注数据,旨在通过深度学习模型识别如行走、上楼、下楼、坐、站和躺等六种人类活动。该数据集源自UCI数据仓库,其核心研究问题是通过传感器数据实现高精度的人类活动识别,对智能健康监测和辅助生活领域具有重要影响。
当前挑战
该数据集面临的挑战主要集中在两个方面。首先,活动识别是一个复杂的时间序列分类任务,涉及从原始传感器数据中提取有效特征,这需要深厚的领域知识和信号处理技术。其次,数据集的构建过程中,如何有效地预处理和特征工程是一个关键挑战,尤其是在处理噪声和信号重叠时。此外,尽管数据集在类别分布上相对平衡,但模型在某些类别(如坐和站)之间的混淆仍然是一个需要解决的问题。
常用场景
经典使用场景
在智能设备广泛应用的背景下,Human Activity Recognition Using Smartphones Sensor DataSet 数据集的经典使用场景主要集中在通过智能手机内置的加速度计和陀螺仪传感器,实时监测和识别用户的日常活动。该数据集通过记录用户在执行不同活动(如行走、上楼、下楼、坐下、站立和躺下)时的传感器数据,为研究人员提供了一个标准化的数据集,用于训练和验证活动识别模型。通过分析这些传感器数据,模型可以准确地预测用户当前的活动状态,从而为健康监测、运动分析等领域提供支持。
衍生相关工作
基于该数据集,许多经典工作得以展开,尤其是在活动识别和时间序列分类领域。研究人员通过该数据集验证了多种机器学习模型(如逻辑回归、支持向量机、决策树、随机森林等)和深度学习模型(如卷积神经网络、循环神经网络等)的性能。此外,该数据集还激发了大量关于特征工程和数据增强的研究,推动了传感器数据处理技术的发展。许多研究工作通过改进特征提取方法或引入新的深度学习架构,进一步提升了活动识别的准确性和鲁棒性。
数据集最近研究
最新研究方向
在智能设备日益普及的背景下,基于智能手机传感器数据的人类活动识别(HAR)研究正成为人工智能领域的前沿课题。该数据集通过智能手机内置的加速度计和陀螺仪传感器,捕捉了30名参与者在执行日常活动时的运动数据,为研究提供了丰富的数据支持。近年来,研究者们不仅关注传统机器学习模型在HAR任务中的应用,如逻辑回归、支持向量机和随机森林等,还积极探索深度学习模型在处理原始传感器数据中的潜力。特别是,卷积神经网络(CNN)和循环神经网络(RNN)等深度学习架构在处理时间序列数据方面表现出色,能够有效捕捉复杂的运动模式。此外,随着可穿戴设备的普及,结合多种传感器数据(如心率数据)进行多模态融合的研究也逐渐成为热点,旨在提高活动识别的准确性和鲁棒性。这些研究不仅推动了HAR技术在健康监测、运动分析等领域的应用,还为智能设备在日常生活中的广泛应用提供了技术支持。
以上内容由遇见数据集搜集并总结生成



