WildPPG
收藏Hugging Face2025-04-17 更新2025-04-18 收录
下载链接:
https://huggingface.co/datasets/eth-siplab/WildPPG
下载链接
链接失效反馈官方服务:
资源简介:
WildPPG是一个真实世界的长时间连续PPG信号数据集,包含16位参与者的手腕PPG信号和心率数据,适用于心率相关的分析和研究。
创建时间:
2025-04-06
搜集汇总
数据集介绍

构建方式
WildPPG数据集作为神经信息处理系统大会(NeurIPS 2024)官方收录的基准数据集,采用真实世界环境下的长期连续记录方式构建。研究团队通过可穿戴设备采集16名受试者在自然活动状态下的光电容积描记(PPG)信号,同步记录心率、海拔等多模态生理数据。数据以MATLAB格式存储,每个受试者的数据包含14个独立变量单元,涵盖手腕PPG信号、心率值等核心生理指标,原始数据经过专业医疗设备校准以确保可靠性。
特点
该数据集最显著的特征在于其真实场景下的长时程连续性,有效弥补了实验室环境PPG数据的局限性。数据包含超过10万条样本,每条PPG信号均配有精确到次的心率标注,且通过30bpm阈值过滤和归一化处理确保数据质量。多受试者设计支持域适应研究,16个独立数据域(每位受试者为一个域)包含个体生理差异,为迁移学习提供理想测试平台。数据维度包含原始PPG波形与时域特征,支持从信号处理到深度学习等多种研究方法。
使用方法
使用者可通过Python的scipy.io.loadmat或MATLAB原生load函数加载数据文件。数据集提供标准化处理函数load_domain_data,支持按受试者索引(0-15)提取特定个体的PPG信号和对应心率标签,自动完成无效样本过滤(NaN/Inf及心率<30bpm)和心率归一化处理(基准值30bpm归零)。返回的X为预处理后的PPG信号矩阵(样本数×信号维度),y为调整后心率值,d为域标签。典型应用包括:通过x, y, d = load_domain_data(3)加载第三位受试者数据,适用于生理状态监测算法开发与验证。
背景与挑战
背景概述
WildPPG数据集由苏黎世联邦理工学院(ETH Zürich)的Sensing, Interaction & Perception Lab团队于2024年发布,旨在为光电容积描记(PPG)信号研究提供真实场景下的长期连续记录数据。该数据集收录了16名受试者在自然生活状态下的手腕PPG信号及心率数据,填补了传统实验室环境下采集数据与真实应用场景之间的鸿沟。作为NeurIPS 2024 Datasets & Benchmarks的入选成果,其创新性体现在首次系统性地解决了动态环境中PPG信号质量受运动伪影、环境干扰等因素影响的基准测试难题,为可穿戴健康监测设备的算法开发提供了重要基础。
当前挑战
WildPPG数据集主要针对动态环境下PPG信号与心率估计的鲁棒性建模这一核心挑战。具体而言,运动伪影、皮肤接触变化以及环境光干扰等因素导致信号信噪比显著降低,传统实验室环境下的算法性能普遍下降。在数据构建层面,研究团队需克服多设备同步采集的技术瓶颈,确保长达数小时的连续记录中时间戳精确对齐。此外,数据标注过程涉及医学专家对异常心跳的人工复核,以解决自动检测算法在复杂场景下的误判问题,这些都为数据集的构建带来了显著挑战。
常用场景
经典使用场景
WildPPG数据集作为真实世界光电容积描记(PPG)信号的长期连续记录库,在生理信号处理领域具有重要价值。其经典使用场景包括开发基于PPG信号的心率估计算法,研究人员可通过该数据集训练深度学习模型,验证算法在复杂自然环境下的鲁棒性。数据集包含16名受试者在日常活动中采集的多模态生理信号,为研究运动伪影和环境干扰下的信号恢复提供了理想实验平台。
解决学术问题
该数据集有效解决了可穿戴健康监测领域的核心学术问题。通过提供真实场景下采集的长时程PPG信号,弥补了实验室控制环境数据与实际情况间的鸿沟。其标注的心率值使研究者能够系统评估动态活动对心率监测精度的影响,推动抗运动干扰算法的创新。数据集的多受试者设计还为个性化生理建模提供了数据基础,促进了跨域泛化研究的发展。
衍生相关工作
基于WildPPG已催生多项创新研究,包括基于域适应的跨用户心率估计框架、结合注意力机制的动态信号去噪模型等。该数据集在NeurIPS 2024发布后,迅速成为生理计算领域的基准测试平台。相关衍生工作重点关注迁移学习在异构PPG信号处理中的应用,以及多任务学习框架下同时估计心率和呼吸率等生理参数的方法。
以上内容由遇见数据集搜集并总结生成



