five

CARE-PD

收藏
arXiv2025-10-06 更新2025-10-08 收录
下载链接:
https://arxiv.org/pdf/2510.04312.pdf
下载链接
链接失效反馈
官方服务:
资源简介:
CARE-PD是一个多机构合作的数据集,汇集了来自8个临床中心的9个数据集,涵盖了光学运动捕捉和RGB视频数据。所有序列都通过一个统一的预处理流程转换为匿名化的SMPL网格。CARE-PD是首个专注于帕金森病步态的大型临床标注运动数据集,其中超过三分之一的行走包括由临床医生评定的UPDRS-gait分数。该数据集支持两种关键基准:监督临床评分预测(估计统一帕金森病评分量表UPDRS的步态评分)和无监督运动预训练任务(2D到3D关键点提升和全身3D重建)。

CARE-PD is a multi-institutional collaborative dataset that aggregates 9 datasets from 8 clinical centers, covering optical motion capture and RGB video data. All sequences are converted into anonymized SMPL meshes via a unified preprocessing pipeline. CARE-PD is the first large-scale clinically annotated motion dataset focused on Parkinson's disease gait, where more than one-third of the walking sequences include UPDRS-gait scores rated by clinicians. This dataset supports two key benchmark tasks: supervised clinical score prediction (estimating the gait score of the Unified Parkinson's Disease Rating Scale, UPDRS) and unsupervised motion pre-training tasks (2D-to-3D keypoint lifting and full-body 3D reconstruction).
提供机构:
University of Toronto, Vector Institute, KITE Research Institute-UHN, University of Strasbourg, University Hospitals of Strasbourg, University of Illinois Urbana-Champaign, Federal University of ABC, KU Leuven, Hasselt University, Emory University, University of Bristol
创建时间:
2025-10-06
搜集汇总
数据集介绍
main_image_url
构建方式
在帕金森病步态评估领域,CARE-PD数据集通过整合来自8个临床中心的9个队列数据,构建了目前规模最大的公开三维网格步态数据库。该数据集采用统一预处理流程,将光学运动捕捉和单目视频数据转化为标准化的SMPL网格序列,涵盖数据清洗、时间分割、传感器协调及隐私保护等关键环节。通过模态特异性处理,运动捕捉数据经过质量控制和关节标准化,视频数据则通过WHAM单目网格恢复方法提取三维姿态,最终形成包含8477个行走片段、总计18.66小时的三维步态序列。
特点
该数据集最显著的特点是实现了多中心临床数据的深度融合与标准化表达。所有序列统一采样至30Hz频率,采用无纹理SMPL网格参数确保患者隐私,同时保留完整的运动学特征。数据覆盖帕金森病患者与健康对照群体,包含药物治疗状态、冻结步态标签等临床属性,其中超过三分之一的行走片段具有临床医生评定的UPDRS步态评分。数据集特别注重病理步态模式的多样性,既包含典型帕金森步态特征,也涵盖不同严重程度的运动功能障碍表现,为模型泛化能力评估提供了坚实基础。
使用方法
研究人员可通过两种基准任务开发利用该数据集资源:临床评分预测任务支持监督学习范式,利用轻量级分类器从运动序列中估计UPDRS步态严重程度评分;运动预训练任务则适用于自监督学习,包括2D-3D关键点提升和全身三维重建等目标。数据集提供四种泛化协议评估框架——数据集内评估、跨数据集评估、留一数据集出评估和多数据集域内适应,全面检验模型在不同临床环境下的鲁棒性。使用前需通过分层抽样获得训练/验证/测试划分,所有实验均需遵循受试者级别数据分离原则以确保评估公正性。
背景与挑战
背景概述
帕金森病(PD)的客观步态评估长期受限于缺乏大规模、多样化且具有临床标注的运动数据集。为应对这一挑战,由多国研究机构联合构建的CARE-PD数据集于2025年正式发布,成为目前最大的公开帕金森病三维步态网格数据资源。该数据集整合了来自8个临床中心的9个队列数据,通过标准化预处理流程将光学运动捕捉与单目视频数据统一转化为匿名SMPL网格序列。其核心研究目标在于推动基于机器学习的帕金森病步态严重度自动评估,通过提供临床评分预测与运动预训练任务的基准测试,显著提升了病理步态分析的标准化程度与可复现性。
当前挑战
CARE-PD面临的挑战主要体现在领域问题与构建过程两个维度。在领域层面,帕金森病步态评估需解决UPDRS评分中严重等级样本稀缺导致的类别不平衡问题,以及跨临床中心数据分布差异对模型泛化能力的制约。构建过程中,多模态数据融合需克服不同采集系统(如MoCap与RGB视频)在帧率、标记点布局和视角上的异构性;隐私保护要求通过去除纹理、形状参数等身份信息实现严格匿名化,同时需通过斜率校正等技术保持步态动力学特征的完整性。此外,数据标注存在MDS-UPDRS与原始UPDRS量表混用带来的评分一致性挑战。
常用场景
经典使用场景
在帕金森病运动功能评估领域,CARE-PD数据集最经典的应用场景体现在临床步态评分预测任务中。该数据集通过统一处理的SMPL三维网格序列,为机器学习模型提供了标准化的病理步态表征输入。研究人员利用其丰富的临床标注信息,特别是统一帕金森病评定量表步态分项评分,构建端到端的自动评分系统。这些系统通过分析步态序列中的运动模式特征,实现对帕金森病患者步态障碍程度的客观量化评估,有效克服传统临床评估中主观性强、可重复性差的局限。
实际应用
在实际医疗场景中,CARE-PD数据集支撑的算法模型可部署于帕金森病临床管理全流程。在诊断环节,基于视频的自动步态分析系统能够辅助医生进行早期筛查和鉴别诊断;在病情监测方面,连续采集的步态数据可动态追踪疾病进展和药物疗效;在康复评估中,系统提供的客观量化指标有助于制定个性化康复方案。特别值得注意的是,该数据集验证的模型能够敏感捕捉药物治疗状态、冻结步态存在与否等关键临床特征的变化,为精准医疗提供了可靠的技术支撑。
衍生相关工作
基于CARE-PD数据集衍生出多个具有影响力的研究方向。在表示学习领域,研究者开发了专门针对病理步态特征的编码器架构,如MotionAGFormer和MoMask等模型在该数据集上的优化版本。在域自适应方面,提出了针对临床数据分布差异的迁移学习策略,显著提升了模型在新临床环境中的适应性。生成式模型研究也取得重要进展,GAITGen等工作利用该数据集训练的条件生成模型,能够合成具有特定严重程度的病理步态样本,有效缓解了临床数据中严重病例稀缺的问题。这些衍生工作共同推动了计算神经病学这一交叉学科的快速发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作