PPG authentication dataset
收藏arXiv2025-03-31 更新2025-04-03 收录
下载链接:
https://github.com/thuhci/ANT_PPG
下载链接
链接失效反馈官方服务:
资源简介:
本研究构建了一个用于PPG身份验证的数据集,该数据集由清华大学和蚂蚁集团共同创建,包含了多种日常活动的PPG信号,用于训练和评估MTL-RAPID模型。数据集涵盖了跨活动、跨日以及用户偏好的研究,支持对PPG信号质量和身份验证的联合学习,有助于提高智能手表在日常场景下的身份验证可靠性。
This study constructs a dataset for PPG-based authentication, which was jointly created by Tsinghua University and Ant Group. The dataset includes PPG signals collected under various daily activities, and is used for training and evaluating the MTL-RAPID model. It covers research scenarios across different activities, days and user preferences, supports joint learning of PPG signal quality and authentication tasks, and helps improve the reliability of smartwatch-based authentication in daily real-world scenarios.
提供机构:
清华大学
创建时间:
2025-03-31
搜集汇总
数据集介绍

构建方式
PPG authentication dataset的构建基于多通道光电容积描记(PPG)信号采集技术,采用Maxim和Goodix两种智能手表传感器,在30名受试者进行10种日常活动(如静坐、行走、跳跃等)时同步记录三通道(红、绿、红外)PPG信号。数据采集遵循严格的实验协议,包括标准化动作序列设计和跨日重复测量(最长间隔4个月),并通过4阶Butterworth滤波器(0.5-10Hz)和滑动窗口技术(6秒窗口,2秒重叠)进行预处理,确保信号质量与时间对齐。
特点
该数据集具有三大核心特征:首先,作为目前最大的腕部PPG生物识别数据集,包含30名受试者的多活动、多日跨度的三通道信号;其次,通过光学反射模型(Shafer's Dichromatic Reflection Model)标注生理变异(p(t))与非生理噪声(m(t))的耦合特征,支持信号质量与身份特征的联合分析;最后,数据集涵盖运动伪影(如跳跃时高达3.5%的EER)和跨日生理变异(4天内AUC下降7%)等真实场景挑战,为可靠性研究提供基准。
使用方法
数据集支持两种典型应用范式:在注册阶段,用户需提供至少6秒的PPG片段作为模板;认证阶段则通过MTL-RAPID模型实现双阶段处理——先经质量评估模块过滤运动伪影(通过率可调25%-100%),再通过80k参数的轻量化网络进行身份验证。研究者可采用五折受试者独立交叉验证,以AUC(最高99.2%)和EER(最低3.5%)为核心指标,对比传统PIN认证(攻击成功率71.5% vs PPG的1.4%)。数据集已开源以促进可重复研究。
背景与挑战
背景概述
PPG authentication dataset是由清华大学与蚂蚁集团的研究团队于2025年提出的,旨在探索智能手表在日常场景中基于光电容积描记(PPG)的可靠身份认证方法。该数据集通过多任务学习模型MTL-RAPID,解决了传统PIN认证在小屏幕设备上的输入不便及运动伪影干扰等问题。研究团队通过30名参与者的多活动数据采集(包括静坐、行走、跳跃等),构建了包含三通道PPG信号的ANT数据集,为穿戴式设备的生物特征认证提供了新的研究基准。该工作发表在ACM期刊,通过开源数据集和模型推动了PPG认证技术的实际应用。
当前挑战
PPG认证面临两大核心挑战:1) 领域问题方面,运动伪影和生理变异导致信号可靠性下降,例如剧烈活动时血流信号易受干扰,且个体血管特征会随时间漂移;2) 数据构建过程中,需克服多设备同步采集的硬件差异(如Goodix与Maxim传感器)、跨日数据采集的参与者依从性管理,以及三通道PPG信号(红/绿/红外)的时间对齐问题。此外,模型需在80k参数限制下平衡质量评估与身份验证的精度,这对轻量化架构设计提出严峻考验。
常用场景
经典使用场景
PPG authentication dataset在智能手表生物识别认证领域具有经典应用价值。该数据集通过采集多通道PPG信号(红光、绿光和红外光),记录了30名受试者在10种日常活动中的生理数据,为研究运动伪影和生理变异对认证可靠性的影响提供了重要基准。其典型应用场景包括开发轻量级多任务学习模型,如MTL-RAPID,该模型能同步评估信号质量并完成身份验证,在跨活动和跨日场景中实现了99.2%的AUC和3.5%的EER。
衍生相关工作
基于该数据集衍生的研究形成了三个重要方向:时序特征提取方面,RAPID块结构启发了后续InceptionTime等模型的优化;多模态融合研究中,三通道PPG的互补性验证推动了红外/可见光协同认证的发展;安全增强领域催生了对抗样本防御研究,如通过光学反射模型抵御视频重构攻击。相关成果已被扩展至远程PPG(rPPG)认证等新兴场景。
数据集最近研究
最新研究方向
近年来,PPG身份认证数据集在智能穿戴设备领域的研究取得了显著进展,特别是在多任务学习(MTL)框架下的信号质量评估与身份验证联合优化方面。MTL-RAPID模型的提出,通过仅80k参数的轻量级设计,在跨活动和跨日场景中实现了99.2%的AUC和3.5%的EER,显著提升了日常场景下的认证可靠性。该数据集的开源进一步推动了基于PPG的生物特征认证研究,尤其在应对运动伪影和生理变异等挑战方面提供了重要基准。随着智能手表在健康监测与支付等敏感场景的普及,PPG认证技术因其非侵入性和硬件兼容性,成为替代传统PIN和指纹认证的研究热点。
相关研究论文
- 1Exploring Reliable PPG Authentication on Smartwatches in Daily Scenarios清华大学 · 2025年
以上内容由遇见数据集搜集并总结生成



