five

RealWorld HAR dataset

收藏
github2021-12-04 更新2024-05-31 收录
下载链接:
https://github.com/camielmaseland/HumanActivityRecognition_Thesis
下载链接
链接失效反馈
官方服务:
资源简介:
探索不同传感器类型的人类活动识别数据集,用于模型训练和分析。

A dataset for human activity recognition exploring various sensor types, designed for model training and analysis.
创建时间:
2021-12-03
原始信息汇总

数据集概述

数据集名称

Human Activity Recognition_Thesis

数据集描述

本数据集用于人类活动识别研究,探索不同传感器类型在实际世界中的应用。

作者

P.C.O. Maseland

日期

2021-12-03

数据处理工具

  • Python
  • Numpy
  • Pandas
  • Matplotlib
  • Seaborn
  • Scikit-Learn

文件结构

  • Data Handling: 包含数据预处理和特征提取的笔记本文件。
    • 1.Data Preperation_Final.ipynb
    • 2.Combined Dataset_Final.ipynb
    • 3.Batches_Feature Extraction_Final.ipynb
    • _Data Preperation-GPS.ipynb
    • _Data Preperation-Light.ipynb
    • _Data Preperation-Mic.ipynb
  • Data: 包含用于建模的Totalset+slopes+mean+sd.csv文件。
  • Model notebooks: 包含特征选择、网格搜索和模型构建的笔记本文件。
    • Modeling_Vanilla_Algorithms - Decision tree_Final.ipynb
    • Modeling_Vanilla_Algorithms - Feature Selection_Final.ipynb
    • Modeling_Vanilla_Algorithms - Gridsearch MLR_Final.ipynb
    • Modeling_Vanilla_Algorithms - Gridsearch RF_Final.ipynb
    • Modeling_Vanilla_Algorithms - Multinomial Logistic Regression_Final.ipynb
    • Modeling_Vanilla_Algorithms - RandomForest_Final.ipynb
  • Visualization_Final.ipynb: 包含数据集的可视化文件。
搜集汇总
数据集介绍
main_image_url
构建方式
RealWorld HAR数据集的构建过程严谨且系统,首先通过多个传感器(如加速度计、陀螺仪和磁力计)采集原始数据,随后在数据处理阶段,对这些数据进行预处理,包括数据清洗、标准化和特征提取。接着,将不同传感器的数据集进行合并,形成一个综合的数据集。最后,通过批处理和特征提取,生成用于建模的最终数据集。
特点
该数据集的显著特点在于其多传感器数据的融合,这不仅丰富了数据的维度,也提高了活动识别的准确性。此外,数据集包含了多种预处理和特征提取方法,使得其在不同模型和算法中的适用性广泛。数据集的结构清晰,便于用户理解和使用,同时也提供了详细的可视化工具,帮助用户更好地分析数据。
使用方法
使用RealWorld HAR数据集时,用户首先需要下载数据集文件,并根据需要进行数据预处理。数据集提供了多个Jupyter Notebook文件,涵盖了数据准备、特征提取、模型训练和可视化等步骤,用户可以根据这些文件进行操作。此外,数据集还支持多种机器学习算法,如决策树、多分类逻辑回归和随机森林,用户可以根据自己的需求选择合适的模型进行训练和评估。
背景与挑战
背景概述
在人机交互与智能感知领域,人体活动识别(Human Activity Recognition, HAR)一直是研究的热点。P.C.O. Maseland于2021年创建了RealWorld HAR数据集,旨在通过探索不同传感器类型来提升活动识别的准确性与鲁棒性。该数据集的构建不仅汇集了加速度计、陀螺仪和磁力计等多种传感器数据,还整合了GPS、光传感器和麦克风等其他传感信息,为研究人员提供了一个全面的数据平台。这一数据集的推出,极大地推动了HAR技术在实际应用中的发展,尤其是在智能家居、健康监测和运动分析等领域。
当前挑战
尽管RealWorld HAR数据集在传感器多样性和数据丰富性方面具有显著优势,但其构建过程中仍面临诸多挑战。首先,不同传感器的数据采集频率和精度差异较大,如何有效整合这些异构数据成为一大难题。其次,数据集的规模庞大,处理和存储这些数据需要高效的计算资源和存储技术。此外,数据集的标注工作复杂且耗时,确保标注的准确性和一致性是另一大挑战。最后,如何在保持数据多样性的同时,确保模型的泛化能力和识别精度,也是研究人员需要解决的关键问题。
常用场景
经典使用场景
在人机交互与健康监测领域,RealWorld HAR数据集以其丰富的传感器数据和多样的活动类型,成为研究人类活动识别的经典工具。该数据集通过整合加速度计、陀螺仪和磁力计等多传感器数据,为研究人员提供了详尽的活动特征。经典使用场景包括但不限于:利用机器学习算法,如决策树、随机森林和多元逻辑回归,对数据进行建模,以实现对步行、跑步、坐下等日常活动的精准识别。
衍生相关工作
基于RealWorld HAR数据集,研究者们开展了多项经典工作,推动了活动识别技术的发展。例如,有研究利用该数据集进行多传感器融合算法的研究,提出了新的特征提取方法,显著提高了活动识别的准确性。此外,还有研究探讨了不同机器学习模型在活动识别中的应用,比较了决策树、随机森林和多元逻辑回归等算法的性能。这些工作不仅丰富了活动识别的理论基础,也为实际应用提供了技术支持。
数据集最近研究
最新研究方向
在人体活动识别(Human Activity Recognition, HAR)领域,RealWorld HAR数据集的最新研究方向主要集中在多传感器数据的融合与特征提取上。随着传感器技术的进步,研究人员正致力于整合加速度计、陀螺仪和磁力计等多种传感器的数据,以提高活动识别的准确性和鲁棒性。此外,数据预处理和特征工程的优化也成为研究热点,旨在从复杂的多维数据中提取出更具代表性的特征,从而提升模型的性能。这些研究不仅推动了HAR技术在健康监测、运动分析等领域的应用,也为智能穿戴设备的发展提供了技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作