five

rWISDM

收藏
arXiv2023-05-17 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2305.10222v1
下载链接
链接失效反馈
官方服务:
资源简介:
rWISDM数据集是由麦克马斯特大学电气与计算机工程系创建,用于人类活动识别研究。该数据集包含51个主题,记录了17种活动,使用智能手机和智能手表的内置加速度计和陀螺仪进行数据采集。数据集的创建过程中,研究者修复了智能手机方向和采样频率的不一致性,提高了数据集的准确性和可靠性。rWISDM数据集主要应用于健康医疗、体育竞赛、智慧城市和智能家居等领域,旨在解决人类活动识别的准确性和系统可靠性问题。

The rWISDM dataset was developed by the Department of Electrical and Computer Engineering at McMaster University for human activity recognition research. This dataset includes 51 subjects and records 17 categories of human activities, with data collected using built-in accelerometers and gyroscopes in smartphones and smartwatches. During its creation, researchers resolved inconsistencies in smartphone orientation and sampling frequency, thereby improving the accuracy and reliability of the dataset. The rWISDM dataset is primarily applied in fields such as healthcare, sports competitions, smart cities, and smart homes, with the goal of addressing the challenges of accuracy and system reliability in human activity recognition.
提供机构:
麦克马斯特大学电气与计算机工程系
创建时间:
2023-05-17
搜集汇总
数据集介绍
main_image_url
构建方式
在人类活动识别领域,数据集的构建质量直接影响模型的鲁棒性。rWISDM数据集源于对原始WISDM数据集的系统性修复,该修复过程聚焦于解决传感器数据采集中的不一致性问题。具体而言,研究团队通过分析智能手机加速度计记录的原始信号,识别出设备方向在不同受试者间存在显著差异,这源于设备在口袋中的放置方式未统一。为解决此问题,团队开发了重定向算法,通过比较各轴信号的平均振幅与标准差,将数据统一调整至预设的标准方向。同时,团队发现采样频率并非如文档所述恒定在20Hz,而是因设备型号不同存在波动,通过基于时间戳重新计算频率并对信号进行重采样至20Hz,确保了时序数据的一致性。此外,数据预处理阶段移除了每段活动开始前非相关的过渡信号,并采用基于受试者的划分策略,增强了数据集的可靠性。
特点
rWISDM数据集的核心特点体现在其高度的数据一致性与多硬件兼容性上。作为修复后的公共数据集,它涵盖了51名受试者执行17类活动的记录,数据同时来自智能手机和智能手表的加速度计与陀螺仪传感器,提供了丰富的跨设备比较基础。数据集经过方向与频率校正后,传感器信号的轴向振幅分布趋于统一,有效消除了因设备摆放或采样差异引入的系统偏差,从而提升了特征提取的稳定性。此外,数据集保留了完整的原始时间戳与传感器读数,支持研究者根据需求自定义预处理流程,这为探索人类活动识别模型的鲁棒性与可解释性提供了坚实基础。其修复过程本身也作为方法论范例,强调了在公共数据集中验证数据真实性的重要性。
使用方法
rWISDM数据集适用于人类活动识别模型的训练与评估,尤其在研究跨设备泛化能力与数据修复对模型性能的影响方面具有价值。使用该数据集时,研究者可首先加载修复后的传感器信号,重点关注智能手机与智能手表加速度计记录的五类基本活动(如行走、慢跑、上下楼等)。为模拟实时识别场景,建议将连续的180秒信号按5秒窗口进行分割,并采用1秒步长以增强数据多样性。在模型开发阶段,推荐采用基于受试者的划分方式,例如将41名受试者用于训练,5名用于验证,5名用于测试,以避免受试者间数据泄漏。此外,数据集支持硬件交叉验证实验,即可训练模型于智能手机数据并测试于智能手表数据,反之亦然,以评估模型在不同传感器硬件上的鲁棒性。最终,通过对比修复前后数据上的模型性能指标(如微平均F1分数),可深入分析数据质量对分类器信任度的影响。
背景与挑战
背景概述
在人类活动识别领域,传感器数据的质量直接影响深度学习模型的性能与可信度。rWISDM数据集由McMaster大学与Vector Institute的研究团队于2023年发布,旨在修复原始WISDM数据集中的潜在问题,提升数据真实性。该数据集基于智能手机与智能手表的加速度计和陀螺仪数据,涵盖行走、慢跑、上下楼梯等17类日常活动,涉及51名参与者。其核心研究问题聚焦于通过数据修复增强人类活动识别系统的鲁棒性,推动人工智能在医疗健康、智能家居等领域的可信应用。
当前挑战
rWISDM数据集面临的挑战主要体现在两方面:其一,在解决人类活动识别这一领域问题时,需应对传感器数据因设备异质性、用户行为差异及环境干扰导致的特征不一致性,这直接影响分类器的泛化能力与系统可靠性;其二,在构建过程中,研究团队发现了原始数据中智能手机轴向方向不一致、采样频率波动等隐藏问题,这些数据采集阶段的缺陷需要通过复杂的信号重定向与重采样算法进行校正,以保障数据集的完整性与可用性。
常用场景
经典使用场景
在人类活动识别领域,rWISDM数据集作为修复后的公开资源,常被用于评估深度学习模型在传感器数据上的鲁棒性与泛化能力。其经典应用场景集中于基于智能手机与智能手表加速度计信号的活动分类任务,例如行走、慢跑、上下楼梯、静坐与站立等日常行为的识别。研究者通过该数据集验证模型在跨设备(如手机与手表)与跨用户场景下的性能表现,从而推动活动识别算法在真实环境中的可靠应用。
衍生相关工作
围绕rWISDM数据集,衍生出多项关于人类活动识别方法改进与数据质量评估的研究工作。例如,基于该数据集的跨硬件验证研究推动了设备无关性活动识别模型的发展;其修复方法启发了对其他公开数据集(如UCI-HAR、MobiAct)的类似数据一致性检查。此外,该数据集常被用作基准,用于比较卷积神经网络、循环神经网络等深度学习架构在传感器信号处理中的效能,促进了鲁棒性学习、迁移学习及小样本学习在活动识别领域的应用探索。
数据集最近研究
最新研究方向
在人类活动识别领域,rWISDM数据集作为修复后的公开资源,正推动前沿研究聚焦于数据质量与人工智能可信度的深度融合。当前研究热点围绕传感器数据的一致性校准展开,例如通过智能设备轴定向修复和采样频率标准化,以提升深度学习模型的鲁棒性与泛化能力。这一方向不仅回应了智慧医疗和可穿戴设备中对可靠活动监测的迫切需求,还促进了跨硬件验证方法的创新,为构建高可信度的人机交互系统奠定了数据基础,具有显著的学术与应用价值。
相关研究论文
  • 1
    rWISDM: Repaired WISDM, a Public Dataset for Human Activity Recognition麦克马斯特大学电气与计算机工程系 · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作