PHUMA
收藏github2025-10-31 更新2025-11-01 收录
下载链接:
https://github.com/DAVIAN-Robotics/PHUMA
下载链接
链接失效反馈官方服务:
资源简介:
PHUMA利用大规模人类运动数据,通过仔细的数据筛选和物理约束的重定向来克服物理伪影,创建一个高质量的人形机器人运动数据集
PHUMA leverages large-scale human motion data, overcomes physical artifacts through careful data filtering and physics-constrained retargeting, and constructs a high-quality humanoid robot motion dataset.
创建时间:
2025-10-30
原始信息汇总
PHUMA: Physically-Grounded Humanoid Locomotion Dataset
数据集概述
PHUMA是一个通过大规模人类运动数据创建的高质量人形机器人运动数据集,通过仔细的数据筛选和物理约束的重定向来克服物理伪影。
核心特性
- 利用大规模人类运动数据
- 通过物理感知运动筛选确保物理合理性
- 采用物理约束的运动重定向方法PhySINK
- 适应人形机器人运动
数据集构成
数据来源
- 起始点:Humanoid-X集合
- 参考Humanoid-X仓库:https://github.com/sihengz02/UH-1
数据划分
- 训练集:phuma_train.txt
- 测试集:phuma_test.txt
- 未见视频集:unseen_video.txt
相关数据集
- LAFAN1重定向数据集:https://huggingface.co/datasets/lvhaidong/LAFAN1_Retargeting_Dataset
- LocoMuJoCo重定向数据:https://github.com/robfiras/loco-mujoco
技术依赖
- SMPL-X模型文件:
- SMPLX_FEMALE.npz和SMPLX_FEMALE.pkl
- SMPLX_MALE.npz和SMPLX_MALE.pkl
- SMPLX_NEUTRAL.npz和SMPLX_NEUTRAL.pkl
- 从SMPL-X官方网站下载:https://smpl-x.is.tue.mpg.de/
代码依赖
- 运动跟踪和路径跟随任务使用MaskedMimic代码库:https://github.com/NVlabs/ProtoMotions
引用信息
bibtex @article{lee2025phuma, title={PHUMA: Physically-Grounded Humanoid Locomotion Dataset}, author={Kyungmin Lee and Sibeen Kim and Minho Park and Hyunseung Kim and Dongyoon Hwang and Hojoon Lee and Jaegul Choo}, journal={arXiv preprint arXiv:2510.26236}, year={2025}, }
相关链接
- 论文:https://arxiv.org/abs/2510.26236
- 项目页面:https://davian-robotics.github.io/PHUMA/
- Hugging Face数据集:https://huggingface.co/datasets/DAVIAN-Robotics/PHUMA
搜集汇总
数据集介绍

构建方式
在仿人机器人运动生成领域,PHUMA数据集通过多阶段物理约束流程构建而成。其以Humanoid-X动捕数据为起点,采用物理感知筛选机制剔除不符合动力学规律的运动片段,随后通过SMPL-X人体模型实现运动学参数化。核心创新在于PhySINK物理约束重定向算法,该技术将人体运动映射至仿人机器人时,通过动力学优化确保关节力矩与接触力的物理合理性,最终形成兼具生物运动自然性与机器人运动可行性的数据集合。
特点
该数据集显著特征体现在物理真实性与数据规模的平衡。所有运动序列均通过刚体动力学验证,避免脚底滑动、关节穿透等常见物理异常。数据涵盖行走、奔跑、踢腿等多样化运动模式,并针对Unitree G1等主流仿人机器人平台提供专用适配参数。其独特价值在于同时保留人类运动细节与机器人执行可行性,为物理仿真与强化学习提供高质量基准。数据集还提供标准化训练测试划分,支持跨模型性能对比研究。
使用方法
使用者可通过模块化流程调用数据集资源。初始化阶段需配置SMPL-X模型文件至指定目录,通过预处理脚本将原始动捕数据转换为时序对齐的运动块。重定向模块支持自定义机器人形态参数,生成符合特定硬件约束的运动轨迹。可视化功能允许实时检视运动质量,而标准数据划分文件便于复现论文中的评估实验。该数据集与主流仿真平台兼容,可直接应用于运动模仿、路径跟踪等典型任务场景。
背景与挑战
背景概述
人形机器人运动控制作为机器人学的前沿领域,长期面临物理约束下的动作生成难题。PHUMA数据集由KAIST人工智能研究院下属的DAVIAN Robotics团队于2025年发布,其核心目标是通过物理约束的运动重定向技术,构建高质量的人形机器人运动数据集。该研究团队创新性地融合大规模人体运动数据与物理仿真系统,采用SMPL-X人体建模框架与自主研发的PhySINK算法,有效解决了人体运动向机器人形态转换时的动力学适配问题。该数据集的建立为人形机器人的仿生运动学习提供了标准化基准,显著推进了具身智能在物理交互场景中的研究进程。
当前挑战
在运动重定向领域,传统方法常因忽略物理约束而产生动力学不可行的动作序列。PHUMA数据集构建过程中需攻克双重挑战:其一是运动数据的物理合理性保障,需通过物理感知筛选机制剔除包含滑动脚、失衡姿态等违背物理规律的运动片段;其二是跨形态运动适配的技术瓶颈,研发团队通过开发基于接触点优化的逆向运动学求解器,有效解决了人体拓扑结构与机器人刚性关节之间的运动映射偏差。这些突破性方法为后续研究提供了可复现的物理约束运动生成范式。
常用场景
经典使用场景
在仿人机器人运动规划领域,PHUMA数据集通过物理约束的运动重定向技术,为机器人学习复杂的人类步态模式提供了高质量数据支撑。该数据集常用于训练和验证运动跟踪算法,使机器人能够模仿人类行走、奔跑等基础动作,同时确保动作的物理可行性与稳定性。
衍生相关工作
该数据集催生了系列重要研究,包括基于MaskedMimic框架的运动模仿系统开发,以及结合LAFAN1与LocoMuJoCo数据的跨域运动迁移研究。这些工作进一步拓展了物理约束运动生成的边界,为仿人机器人运动学习建立了完整的理论体系与实践范式。
数据集最近研究
最新研究方向
在仿人机器人运动控制领域,PHUMA数据集通过物理约束的运动重构技术,为生成物理可行的仿人运动轨迹提供了重要支撑。该数据集融合大规模人类动作数据与物理感知筛选机制,有效解决了传统运动重定向过程中的物理失真问题。当前研究热点集中于利用该数据集开发具有动态平衡能力的仿人运动策略,特别是在复杂地形适应与多任务协同控制方面展现出突破潜力。随着仿人机器人商业化进程加速,这类高质量数据集正成为推动具身智能发展的重要基石,为机器人自然运动生成与实时环境交互奠定了数据基础。
以上内容由遇见数据集搜集并总结生成



