monster-monash/PAMAP2
收藏Hugging Face2025-04-14 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/monster-monash/PAMAP2
下载链接
链接失效反馈官方服务:
资源简介:
PAMAP2是一个由三个惯性测量单元(IMU)收集的数据集,这些IMU分别放置在主导手臂的手腕、胸部和脚踝,以及一个ECG心率监测器上。数据以100Hz的频率记录。该数据集包含了9个具有各自独特身体特征的受试者所进行的人类活动的注释信息。大多数受试者是男性,且习惯使用右手。值得注意的是,数据集中只有一名女性受试者(ID 102)和一名左撇子受试者(ID 108)。总共包含12种不同的人类活动类别。处理后的数据集包含38,856个时间序列,每个时间序列长度为100,代表100Hz下的一秒数据。为了确保无偏见的评估,数据集被划分为基于受试者的交叉验证折。
PAMAP2 is a collection of data obtained from three Inertial Measurement Units (IMUs) placed on the wrist of the dominant arm, chest, and ankle, as well as 1 ECG heart rate monitor. The data was recorded at a frequency of 100Hz. The dataset includes annotated information about human activities performed by 9 subjects, each with their own unique physical characteristics. The majority of the subjects are male and right-handed dominant. Notably, the dataset includes only one female subject (ID 102) and one left-handed subject (ID 108). There are a total of 12 different human activity classes represented in the dataset. The processed dataset contains 38,856 time series, each of length 100, representing one second of data per time series at 100 Hz. The dataset is divided into cross-validation folds based on the subjects to ensure an unbiased evaluation.
提供机构:
monster-monash
搜集汇总
数据集介绍

构建方式
在人体活动识别领域,PAMAP2数据集的构建体现了严谨的实验设计。研究团队通过在九名受试者的优势臂手腕、胸部及脚踝处部署惯性测量单元,并同步采集心电图心率数据,以100赫兹的采样频率连续记录多模态时序信号。数据采集过程涵盖了十二类日常活动,最终通过标准化处理生成了38,856条长度为100点的时间序列片段,每条序列对应一秒的传感器观测。为确保评估的公正性,数据集依据受试者身份进行了交叉验证划分,有效避免了主体间差异对模型泛化能力的影响。
特点
PAMAP2数据集的核心特点在于其多传感器融合的高维度时序结构。该数据集共包含52个数据通道,整合了三轴加速度、角速度及心率等多源信息,为复杂活动识别提供了丰富的特征空间。样本覆盖了包括步行、跑步、骑行等十二类常见人体活动,且受试群体在性别与利手性上呈现自然分布,增强了数据的现实代表性。时间序列长度统一为100点,对应固定的1秒时间窗口,这种规范化处理有利于模型输入的标准化,同时保持了原始采样频率下的动态细节。
使用方法
该数据集主要用于时间序列分类任务,特别是在基于传感器的人体活动识别研究中。使用者可加载预处理后的时间序列样本及其对应的活动类别标签,直接用于监督学习模型的训练与验证。由于数据集已按受试者划分为交叉验证折,建议采用主体独立的评估策略,以检验模型对新用户的泛化性能。研究人员可进一步利用多通道时序数据探索特征提取、序列建模或跨传感器融合方法,推动可穿戴计算领域算法的发展。
背景与挑战
背景概述
在可穿戴计算与普适计算领域,人类活动识别(HAR)是理解人机交互、健康监测及智能辅助系统的核心问题。PAMAP2数据集由Attila Reiss与Didier Stricker等研究人员于2012年创建,旨在提供一个标准化的基准数据集,以推动基于多传感器融合的复杂活动识别研究。该数据集通过部署于手腕、胸部及脚踝的惯性测量单元(IMU)与心电图(ECG)设备,以100Hz频率采集了9名受试者执行12类日常与体育活动的数据。其严谨的跨受试者划分策略,显著提升了模型在真实场景中的泛化能力评估可靠性,对后续时间序列分类与行为分析研究产生了深远影响。
当前挑战
PAMAP2数据集致力于解决人类活动识别中多模态传感器数据融合与复杂活动细粒度分类的挑战。具体而言,其需从高维时序信号中有效提取鲁棒特征,以区分动作幅度、频率相近的类别(如不同强度的骑行)。在构建过程中,数据采集面临传感器异质性校准、受试者生理与行为差异(如仅包含单一女性与左利手样本)带来的数据分布偏差,以及自然环境下运动伪影与信号丢失的处理难题。这些因素共同构成了该数据集在推动算法公平性与泛化性研究方面的关键挑战。
常用场景
经典使用场景
在人体活动识别领域,PAMAP2数据集以其多传感器、高采样频率的特性,成为评估时间序列分类算法的经典基准。该数据集通过手腕、胸部和脚踝佩戴的惯性测量单元,精确捕捉了12类日常活动的运动模式,如行走、跑步和上下楼梯等。研究者常利用其进行监督学习模型的训练与验证,特别是在跨被试的交叉验证设置下,能够有效检验算法在个体差异下的泛化能力,推动了活动识别精度的持续提升。
衍生相关工作
围绕PAMAP2数据集,衍生了一系列经典研究工作,显著推动了时间序列分析领域的进展。例如,许多研究利用卷积神经网络与长短时记忆网络结合该数据,探索多传感器融合的端到端分类框架。此外,针对数据不平衡与个体差异问题,迁移学习与域自适应方法被广泛引入,以提升模型在新用户上的适应性。这些工作不仅丰富了活动识别的理论体系,也为后续如PAMAP2等基准数据集的扩展与标准化提供了重要参考。
数据集最近研究
最新研究方向
在可穿戴计算与健康监测领域,PAMAP2数据集作为经典基准,持续推动人类活动识别(HAR)技术的演进。当前研究聚焦于融合多模态传感器数据,利用深度学习模型如卷积神经网络与长短时记忆网络,提升复杂日常活动与微弱动作模式的分类精度。前沿探索涉及跨域自适应学习,以解决个体差异与传感器部署变化带来的泛化挑战,同时结合联邦学习框架保护用户隐私。该数据集亦在跌倒检测、康复评估等健康应用中发挥关键作用,为智能健康系统的实时性与可靠性提供实证基础,促进了物联网与人工智能在个性化医疗中的深度融合。
以上内容由遇见数据集搜集并总结生成



