Human-Activity-Recognition-Dataset
收藏github2020-08-06 更新2024-05-31 收录
下载链接:
https://github.com/Jayesh-29/Human-Activity-Recognition-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
人类活动识别数据集基于30名年龄在19至48岁之间的参与者进行实验构建,参与者在进行日常活动(如走路、上楼、下楼、坐、站、躺)时佩戴腰部的三星Galaxy S II智能手机。通过内置的加速度计和陀螺仪,以50Hz的速率捕获了三轴线性加速度和三轴角速度。实验过程被录像以便手动标记数据。该数据集随后被随机分为两部分;70%的数据用于生成训练数据,剩余30%用于测试数据。数据描述:该数据集包含561个预测因子(列),包括时域和频域变量及其相应的活动标签。收集的数据经过预处理以消除噪声。传感器加速度信号包含重力和身体运动成分,这些成分通过Butterworth低通滤波器分离。
The Human Activity Recognition dataset was constructed through experiments involving 30 participants aged between 19 and 48 years. Participants wore a Samsung Galaxy S II smartphone on their waist while performing daily activities such as walking, going upstairs, going downstairs, sitting, standing, and lying down. The built-in accelerometer and gyroscope captured triaxial linear acceleration and triaxial angular velocity at a rate of 50Hz. The experimental process was videotaped to facilitate manual labeling of the data. The dataset was subsequently randomly divided into two parts; 70% of the data was used to generate training data, while the remaining 30% was reserved for testing. Data Description: The dataset comprises 561 predictors (columns), including time-domain and frequency-domain variables along with their corresponding activity labels. The collected data underwent preprocessing to eliminate noise. The sensor acceleration signals, which include both gravity and body motion components, were separated using a Butterworth low-pass filter.
创建时间:
2020-04-29
原始信息汇总
数据集概述
数据集名称
Human Activity Recognition Dataset
数据集描述
- 参与者信息:30名年龄在19至48岁之间的参与者。
- 活动类型:日常活动包括行走、上楼、下楼、坐、站、躺。
- 设备:参与者佩戴腰部的三星Galaxy S II智能手机。
- 数据采集:通过内置的加速度计和陀螺仪,以50Hz的频率捕获3轴线性加速度和3轴角速度。
- 数据处理:数据经过随机分割,70%用于训练,30%用于测试。
- 数据特征:包含561个预测因子(列),涉及时间和频率域变量及其对应的活性标签。
- 预处理:数据进行了噪声预处理,使用Butterworth低通滤波器分离了重力和身体运动成分。
数据集链接
搜集汇总
数据集介绍

构建方式
Human-Activity-Recognition-Dataset的构建基于30名年龄在19至48岁之间的参与者进行的实验。这些参与者在进行日常活动(如行走、上下楼梯、坐、站、躺)时,佩戴了一款腰挂式智能手机(三星Galaxy S II)。通过手机内置的加速度计和陀螺仪,以50Hz的频率捕捉了三轴线性加速度和三轴角速度数据。实验过程通过视频记录,以便手动标注数据。随后,数据集被随机分为两部分,70%的参与者数据用于生成训练集,剩余的30%用于测试集。数据预处理过程中,通过巴特沃斯低通滤波器分离了传感器加速度信号中的重力和身体运动分量。
特点
该数据集包含了561个预测变量,涵盖了时域和频域的特征及其对应的活动标签。数据经过噪声预处理,确保了信号的质量。传感器捕捉的加速度信号不仅包含了身体运动信息,还通过滤波器分离了重力分量,使得数据能够更精确地反映人体活动的动态特性。这种多维度的数据特征为活动识别提供了丰富的分析基础。
使用方法
该数据集适用于机器学习模型的训练与测试,特别是用于人类活动识别任务。用户可以通过Kaggle平台获取数据集文件,并利用其提供的561个特征进行模型开发。训练集和测试集的划分已预先完成,用户可直接用于模型训练和验证。数据预处理步骤已包含噪声过滤和信号分离,用户可根据需求进一步调整或扩展特征工程。该数据集为研究人类活动识别算法提供了高质量的基础数据。
背景与挑战
背景概述
Human-Activity-Recognition-Dataset(人类活动识别数据集)由30名年龄在19至48岁之间的参与者通过佩戴三星Galaxy S II智能手机进行日常活动(如行走、上下楼梯、坐、站、躺)时生成。该数据集通过内置的加速度计和陀螺仪捕捉了50Hz频率下的3轴线性加速度和3轴角速度数据,并通过视频记录手动标注。数据经过预处理以去除噪声,并采用Butterworth低通滤波器分离重力与身体运动分量。该数据集由70%的训练数据和30%的测试数据组成,包含561个时间域和频率域特征变量及其对应的活动标签,为人类活动识别研究提供了重要支持。
当前挑战
该数据集的核心挑战在于如何从复杂的传感器数据中准确识别和分类人类活动。由于传感器数据包含噪声以及重力与身体运动的混合分量,如何有效分离这些信号并提取有意义的特征是关键问题。此外,数据的高维度(561个特征)增加了模型训练的复杂性,可能导致过拟合或计算资源消耗过大。在构建过程中,手动标注数据的准确性和一致性也面临挑战,尤其是在多参与者、多活动场景下,确保标签的可靠性需要大量人工干预和验证。
常用场景
经典使用场景
Human-Activity-Recognition-Dataset 数据集广泛应用于人体活动识别领域,尤其是在基于智能手机传感器的行为分析研究中。通过捕捉佩戴者进行日常活动(如行走、上下楼梯、坐立等)时的加速度和角速度数据,该数据集为研究人员提供了一个标准化的实验平台,用于开发和验证活动识别算法。其经典使用场景包括机器学习模型的训练与测试,特别是在监督学习框架下,研究者可以利用该数据集中的561个特征变量来预测六种不同的日常活动。
衍生相关工作
该数据集衍生了许多经典研究工作,特别是在深度学习和传统机器学习领域。例如,基于该数据集的研究提出了多种高效的活动识别模型,如卷积神经网络(CNN)和长短期记忆网络(LSTM)的变体。此外,一些研究还探索了特征选择和降维技术,以提升模型的性能和计算效率。这些工作不仅推动了活动识别技术的发展,还为其他传感器数据分析任务提供了重要的方法论参考。
数据集最近研究
最新研究方向
在人类活动识别领域,基于智能手机传感器的数据集如Human-Activity-Recognition-Dataset正成为研究热点。该数据集通过捕捉30名参与者在日常活动中的加速度和角速度数据,为深度学习模型提供了丰富的训练和测试素材。近年来,研究者们利用该数据集探索了多种先进算法,如卷积神经网络(CNN)和长短期记忆网络(LSTM),以提高活动识别的准确性和鲁棒性。此外,结合多模态数据融合技术,研究者们正在尝试将视觉信息与传感器数据相结合,以进一步提升识别效果。这一研究方向不仅推动了智能健康监测系统的发展,还为个性化医疗和智能家居等应用场景提供了重要支持。
以上内容由遇见数据集搜集并总结生成



