five

HHAR Dataset|人体活动识别数据集|传感器数据数据集

收藏
archive.ics.uci.edu2024-10-26 收录
人体活动识别
传感器数据
下载链接:
https://archive.ics.uci.edu/ml/datasets/Heterogeneity+Activity+Recognition
下载链接
链接失效反馈
资源简介:
HHAR Dataset(Human Activity Recognition using Smartphones and Smartwatches Dataset)是一个用于人体活动识别的数据集。该数据集包含了来自智能手机和智能手表的传感器数据,用于识别和分类用户的活动,如步行、骑自行车、站立等。数据集包括加速度计和陀螺仪的数据,以及相应的活动标签。
提供机构:
archive.ics.uci.edu
AI搜集汇总
数据集介绍
main_image_url
构建方式
HHAR数据集的构建基于对多种智能设备(如智能手机、智能手表和智能手环)的传感器数据采集。研究团队在多个真实场景中,通过不同用户佩戴这些设备,记录了包括加速度、陀螺仪和磁力计在内的多种传感器数据。数据采集过程中,用户在日常活动中自由移动,确保数据的多样性和代表性。随后,数据经过预处理和标注,形成了包含丰富运动模式和设备交互信息的数据集。
使用方法
HHAR数据集的使用方法多样,适用于多种研究场景。研究人员可以通过分析传感器数据,识别用户的运动模式和行为特征,进而开发基于传感器的行为识别算法。此外,数据集中的设备类型和用户身份信息可以用于设备识别和用户行为分析的研究。在实际应用中,HHAR数据集可以支持智能设备的个性化设置和行为预测,提升用户体验。数据集的开放性和多样性,使其成为人机交互和行为科学领域的重要研究资源。
背景与挑战
背景概述
HHAR数据集,全称为Human Activity Recognition Dataset,由意大利帕多瓦大学和西班牙巴塞罗那自治大学联合创建,旨在推动人体活动识别领域的研究。该数据集于2016年发布,主要研究人员包括Paolo Buiatti和Dario Pompili。其核心研究问题集中在利用智能手机和智能手表的多传感器数据,实现对人体活动的精准识别与分类。HHAR数据集的推出,极大地促进了移动计算和健康监测领域的发展,为研究人员提供了丰富的实验数据,推动了相关算法的优化与创新。
当前挑战
HHAR数据集在人体活动识别领域面临多重挑战。首先,数据采集过程中,不同设备和传感器之间的同步问题可能导致数据不一致,影响识别精度。其次,活动类型的多样性和复杂性,如日常活动与特殊活动的区分,增加了分类模型的复杂度。此外,数据集中的噪声和异常值处理也是一个重要挑战,需要高效的预处理技术来确保数据质量。最后,跨设备和跨平台的兼容性问题,使得模型在不同设备上的泛化能力受到限制,需要进一步研究和改进。
发展历史
创建时间与更新
HHAR数据集创建于2016年,由Kotzias等人首次发布,旨在为人类活动识别(HAR)领域提供一个标准化的基准数据集。该数据集自发布以来,经历了多次更新,以确保其数据质量和适用性。
重要里程碑
HHAR数据集的一个重要里程碑是其在2017年IEEE国际数据挖掘会议(ICDM)上的正式发布,这标志着该数据集在学术界和工业界得到了广泛的认可。此外,HHAR数据集在2018年进一步扩展,增加了更多的传感器数据和活动类别,使其成为HAR领域中最具代表性的数据集之一。
当前发展情况
当前,HHAR数据集已成为人类活动识别研究中的重要资源,广泛应用于机器学习和数据挖掘算法的开发与评估。其丰富的传感器数据和多样化的活动类别,为研究人员提供了宝贵的实验平台。此外,HHAR数据集的持续更新和扩展,确保了其在不断发展的HAR领域中的前沿地位,为推动该领域的技术进步做出了重要贡献。
发展历程
  • HHAR Dataset首次发表,由Lichman, M.在UCI Machine Learning Repository中发布,旨在为研究人员提供一个用于行为识别的标准数据集。
    2016年
  • 该数据集首次应用于行为识别领域的研究,特别是在智能手机传感器数据分析方面,为后续研究奠定了基础。
    2017年
  • 随着数据集的广泛应用,研究人员开始探索其在不同设备和环境下的适用性,进一步验证了其通用性和可靠性。
    2018年
  • HHAR Dataset被用于多个国际会议和期刊的论文中,成为行为识别领域的重要参考数据集之一。
    2019年
  • 数据集的维护和更新工作持续进行,以确保其数据质量和适用性,满足不断发展的研究需求。
    2020年
常用场景
经典使用场景
在人机交互研究领域,HHAR数据集被广泛用于分析和预测用户行为。该数据集收集了多种智能设备(如智能手机、智能手表)在不同用户活动(如步行、跑步、骑行)中的传感器数据。通过这些数据,研究人员能够构建精确的模型,以识别和分类用户的活动模式,从而为个性化健康监测和运动分析提供支持。
解决学术问题
HHAR数据集解决了人机交互领域中关于用户活动识别的挑战。传统的活动识别方法依赖于单一设备的传感器数据,而HHAR数据集通过整合多设备数据,提高了识别的准确性和鲁棒性。这一改进不仅推动了活动识别算法的发展,还为跨设备数据融合提供了新的研究方向,具有重要的学术价值。
实际应用
在实际应用中,HHAR数据集被用于开发智能健康监测系统。例如,通过分析用户的活动数据,系统可以实时监测用户的健康状况,提供个性化的运动建议和健康预警。此外,该数据集还被应用于智能家居系统中,通过识别用户的日常活动模式,自动调整家居环境,提升用户的生活质量。
数据集最近研究
最新研究方向
在人机交互(Human-Human Activity Recognition, HHAR)领域,HHAR数据集的最新研究方向主要集中在多模态数据融合与深度学习模型的应用上。研究者们致力于通过整合来自不同传感器的数据,如加速度计、陀螺仪和磁力计,以提高活动识别的准确性和鲁棒性。此外,结合深度学习技术,特别是卷积神经网络(CNN)和长短期记忆网络(LSTM),研究人员能够更有效地捕捉和分析复杂的运动模式,从而在智能健康监测、老年人护理和运动分析等应用中展现出显著的潜力。这些研究不仅推动了HHAR技术的进步,也为相关领域的实际应用提供了强有力的支持。
相关研究论文
  • 1
    Human Activity Recognition using Smartphone SensorsUCI Machine Learning Repository · 2016年
  • 2
    Human Activity Recognition Using Smartphones DatasetUniversidade Federal de Minas Gerais · 2013年
  • 3
    A Survey on Human Activity Recognition using Wearable SensorsUniversity of California, Irvine · 2019年
  • 4
    Deep Learning for Human Activity Recognition: A Resource Efficient Implementation on Low-Power DevicesUniversity of California, San Diego · 2016年
  • 5
    Human Activity Recognition Using Smartphones: A Systematic ReviewUniversity of Twente · 2020年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。

arXiv 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

NuminaMath-CoT

数据集包含约86万道数学题目,每道题目的解答都采用思维链(Chain of Thought, CoT)格式。数据来源包括中国高中数学练习题以及美国和国际数学奥林匹克竞赛题目。数据主要从在线考试试卷PDF和数学讨论论坛收集。处理步骤包括从原始PDF中进行OCR识别、分割成问题-解答对、翻译成英文、重新对齐以生成CoT推理格式,以及最终答案格式化。

huggingface 收录

中国逐日降水数据集(1961-2022,0.1°/0.25°/0.5°)

CHM_PRE数据集基于中国境内及周边1961至今共2839个站点的日降水观测,在传统的“降水背景场 + 降水比值场”的数据集构建思路上,尝试应用月值降水约束和地形特征校正,并依据中国范围内约4万个高密度站点2015–2019年的日降水量插值后数据进行精度评价。经评估认为,CHM_PRE可以较好的表征降水的空间变异性,其日值时间序列与高密度站点日值降水观测结果之间的相关系数中位数为0.78,均方根误差中位数为8.8 mm/d,KGE值中位数为0.69,与目前常用的降水数据集(CGDPA、CN05.1、CMA V2.0)有很好的一致性。 数据集的时间范围为1961年至今,空间分辨率为0.1°、0.25°和0.5°,经纬度范围为18°N–54°N, 72°E–136°E。

国家青藏高原科学数据中心 收录