five

AMASS_Retargeted_for_G1

收藏
Hugging Face2026-04-30 更新2026-05-01 收录
下载链接:
https://huggingface.co/datasets/leeyngdo/AMASS_Retargeted_for_G1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从AMASS重定向到Unitree G1 29自由度人形机器人的运动数据,使用了两种互补的重定向管道:NMR(神经运动重定向)和GMR(通用运动重定向)。NMR提供基于学习的平滑重定向,包含16,297个序列,存储为.npz文件,包含关节角度、根位置和旋转四元数等信息。GMR提供基于逆向运动学的重定向,专为G1调整,包含17,029个序列,存储为.pkl文件,额外提供身体链接位置信息。数据集适用于机器人运动控制、运动重定向等任务,需遵守AMASS的原始许可要求。
创建时间:
2026-04-20
原始信息汇总

数据集概述:AMASS Retargeted for Unitree G1 Humanoid

基本信息

  • 数据集名称:AMASS Retargeted for G1 Humanoid (NMR + GMR)
  • 许可协议:AMASS 许可协议(AMASS License
  • 任务类别:机器人学
  • 标签:运动重定向、人形机器人、AMASS、SMPL-X、G1、GMR、NMR
  • 数据规模:10,000 < 样本数 < 100,000
  • 目标机器人:Unitree G1(29自由度身体 + 自由浮动根部)

数据集组成

数据集包含两个变体版本,分别采用不同的运动重定向管线将 AMASS 数据集中的动作重定向到 Unitree G1 29自由度人形机器人

变体 管线 源数据 帧率 文件格式 序列数
g1/NMR/ NMR — 神经运动重定向 AMASS SMPL-X 中性模型,Stage II 30 FPS .npz 16,297
g1/GMR/ GMR — 通用运动重定向 (unitree_g1 29 DOF) AMASS SMPL-X 性别特定模型,Stage II 30 FPS .pkl 17,029

目录结构

g1/ ├── NMR/ │ ├── ACCAD/ │ ├── BMLmovi/ │ ├── ... │ └── WEIZMANN/ └── GMR/ ├── ACCAD/ ├── BMLmovi/ ├── ... └── WEIZMANN/

  • g1/NMR/<数据集>/:每个运动序列一个 .npz 文件,文件名格式为 <数据集>__<受试者>__<动作>_stageii.npz
  • g1/GMR/<数据集>/:镜像原始 AMASS 目录结构,例如 g1/GMR/CMU/15/15_02_stageii.pkl

变体1:NMR (g1/NMR/)

处理方法

  • 使用 RayZhao/NMRepoch_30.pth 模型进行神经运动重定向。
  • 后处理:当序列长度 > 15 帧时,应用 4 阶 Butterworth 低通滤波器(5 Hz,30 FPS)。

文件格式

每个 .npz 文件包含以下键:

键名 形状 数据类型 描述
dof (T, 29) float32 G1 关节角度(弧度)
root_trans (T, 3) float32 根部 XYZ 位置(米,Y向上)
root_rot_quat (T, 4) float32 根部方向四元数 (w, x, y, z)
source_path () str 重定向时源 AMASS .npz 的绝对路径

T 为帧数,帧率 30 FPS。

加载示例

python import numpy as np data = np.load("g1/NMR/CMU/CMU__15__15_02_stageii.npz") dof = data["dof"] # (T, 29) trans = data["root_trans"] # (T, 3) quat = data["root_rot_quat"] # (T, 4), w-first

各数据集序列统计(NMR)

数据集 序列数
ACCAD 252
BMLmovi 1,863
BMLrub 3,060
CMU 1,981
CNRS 79
DFaust 129
EKUT 348
EyesJapanDataset 750
GRAB 675
HDM05 215
HumanEva 28
KIT 4,231
MoSh 77
PosePrior 35
SFU 44
SOMA 69
SSM 30
TCDHands 62
TotalCapture 37
Transitions 110
WEIZMANN 2,222
总计 16,297

覆盖说明(NMR)

  • 1个文件不可恢复BMLmovi/Subject_49_F_MoSh/Subject_49_F_19_stageii.npz — 官方 AMASS 压缩包中的对应 NPZ 文件损坏,无法重定向。

变体2:GMR (g1/GMR/)

处理方法

  • 使用 GMR(通用运动重定向) v0.2.0,目标 unitree_g1(29 DOF),配置文件 smplx_to_g1.json
  • 采用 Mink/MuJoCo IK 解算器,自动人体高度缩放。
  • 序列重采样至 30 FPS,根部 XY 原点偏移至第一帧,最低身体链接接地于 z=0。

文件格式

每个 .pkl 文件是一个 Python pickle 字典,包含以下键:

键名 形状 数据类型 描述
fps 标量 float 对齐帧率(30.0)
root_pos (T, 3) float64 根部 XYZ 位置(米)
root_rot (T, 4) float64 根部方向四元数 (x, y, z, w)(scipy 约定)
dof_pos (T, 29) float64 G1 关节角度(弧度)
local_body_pos (T, 38, 3) float32 根部局部坐标系中的身体链接 XYZ 位置(使用单位根部姿态的前向运动学计算)
link_body_list list[str] 38个身体链接的名称(与 local_body_pos 的轴1对应)

T 为帧数,帧率 30 FPS。dof_pos 的顺序与 GMR 打印的 G1 电机列表一致(骨盆 → 腿部 → 腰部 → 手臂)。

加载示例

python import pickle with open("g1/GMR/CMU/15/15_02_stageii.pkl", "rb") as f: data = pickle.load(f) dof_pos = data["dof_pos"] # (T, 29) root_pos = data["root_pos"] # (T, 3) root_rot = data["root_rot"] # (T, 4), x,y,z,w local_body_pos = data["local_body_pos"] # (T, 38, 3) link_body_list = data["link_body_list"] # list of 38 link names

各数据集序列统计(GMR)

数据集 序列数
ACCAD 247
BMLmovi 1,864
BMLrub 3,061
CMU 1,983
CNRS 79
DanceDB 151
DFaust 129
EKUT 348
Eyes_Japan_Dataset 750
GRAB 1,340
HDM05 215
HUMAN4D 148
HumanEva 28
KIT 4,007
MoSh 77
PosePrior 35
SFU 44
SOMA 69
SSM 30
TCDHands 62
TotalCapture 37
Transitions 103
WEIZMANN 2,222
总计 17,029

覆盖说明(GMR)

  • GMR 管线排除了一组手工筛选的不适合 G1 重定向的动作,包括爬行、躺卧、上楼梯、下楼梯等序列,以及匹配 GMR 仓库 assets/hard_motions/{0,1}.txt 列表中的动作路径。因此部分原始 AMASS 存档中的 Stage II 文件未包含在此数据集中。

引用与许可

  • 引用要求:使用本数据集时,请引用 AMASS 以及所使用的重定向管线(NMR 或 GMR),详见原始页面中的 BibTeX 引用信息。
  • 许可协议:使用本数据需遵守原始 AMASS 许可协议 (https://amass.is.tue.mpg.de/license.html)。每个 AMASS 子数据集保留自身许可条款,下载任何子集均须遵守相应许可。重定向动作衍生自 AMASS,继承相同的使用限制。
搜集汇总
数据集介绍
main_image_url
构建方式
AMASS_Retargeted_for_G1数据集源于对AMASS Stage II阶段人体运动数据的重定向处理,专为Unitree G1 29自由度人形机器人设计。数据集包含两种互补的重定向管线:基于神经网络的NMR(Neural Motion Retargeting)和基于逆运动学的GMR(General Motion Retargeting)。NMR管线利用预训练模型将SMPL-X中性模型运动重定向至G1,并辅以4阶巴特沃斯低通滤波以平滑输出。GMR管线则采用Mink/MuJoCo求解器,针对性别特异性SMPL-X模型进行重定向,自动缩放人体高度并调整根部位姿,生成包含38个身体链接位置的丰富运动表示。
使用方法
使用该数据集时,用户可根据应用需求选择NMR或GMR版本。加载NMR数据可借助NumPy库读取.npz文件中的'dof'、'root_trans'和'root_rot_quat'键值,分别对应关节角度、根部位移和姿态四元数。加载GMR数据则需使用Pickle库,读取'dof_pos'、'root_pos'、'root_rot'、'local_body_pos'和'link_body_list'字段。GMR版本额外提供38个身体链接的局部位置,便于进行全身运动分析或控制策略开发。研究者应注意遵守AMASS及其子数据集的许可条款,并在相关研究中标注所采用的重定向管线。
背景与挑战
背景概述
AMASS_Retargeted_for_G1数据集由清华大学及北京通用人工智能研究院等机构的研究人员于2025至2026年间创建,旨在填补动作重定向领域中人形机器人运动数据的稀缺。该数据集基于AMASS高精度人体运动数据库,将SMPL-X人体运动序列通过神经运动重定向(NMR)与通用运动重定向(GMR)两条互补管线,映射至宇树G1 29自由度人形机器人。其核心研究问题在于弥合拟人运动捕捉数据与具身机器人控制之间的鸿沟,为全身控制算法和仿真训练提供标准化运动先验。该数据集涵盖超过1.6万至1.7万条运动序列,横跨数十个子数据集,显著推动了人形机器人运动跟踪、策略泛化及行为克隆领域的发展,已成为相关研究的重要基准。
当前挑战
数据集面临的挑战体现在两个层面。在领域问题层面,所解决的痛点在于将高维、连续、具身约束的复杂人体运动迁移至结构迥异的人形机器人上,传统手动调整或纯运动学方法难以兼顾运动自然度、动态稳定性和硬件限制。在构建层面,挑战包括:1)源数据中部分AMASS文件存在损坏或截断(如BMLmovi子集中一个npz文件无法恢复),导致重定向过程不完整;2)GMR管线需人工筛选并排除爬行、躺卧等不利于人形机器人执行的姿态序列,引入主观偏差;3)两条管线输出格式差异(NMR的.npz与GMR的.pkl)及关节顺序、局部坐标系定义的不同,增大了下游使用的一致性维护难度。
常用场景
经典使用场景
AMASS_Retargeted_for_G1数据集专为将丰富的人体运动捕捉数据迁移至Unitree G1人形机器人而构建。其经典使用场景在于为高自由度(29-DOF)人形机器人的运动重定向提供大规模、格式统一的训练与评估基准。通过集成神经运动重定向(NMR)和通用运动重定向(GMR)两种互补管道,该数据集将原始AMASS中涵盖行走、奔跑、跳跃、舞蹈等复杂人体动作的序列,精准映射为机器人关节角度、根部位置与姿态四元数等控制信号。研究者可直接利用这些预处理后的数据,用于监督式学习、强化学习策略训练,或评估不同重定向算法在机器人运动保真度与物理可行性上的表现,显著降低了从人类演示到机器人技能习得之间的技术门槛。
解决学术问题
该数据集有效解决了人形机器人运动控制研究中长期存在的关键瓶颈——缺乏大规模、多样化的高质量运动重定向数据。传统方法往往依赖手工设计的运动库或有限的动作捕捉重定向样本,导致机器人动作泛化能力不足、运动模式单一。AMASS_Retargeted_for_G1通过覆盖AMASS中数十个子数据集(如CMU、KIT、WEIZMANN等),提供了超过一万六千条序列,极大丰富了机器人运动数据的规模与多样性。这为研究运动重定向算法的鲁棒性、跨风格泛化能力、以及从人类运动到机器人动作域迁移的底层数学与物理约束问题奠定了坚实的实验基础。其意义在于推动了仿真环境与真实机器人之间的运动知识迁移,加速了全身协调控制、动态平衡调节等核心学术议题的突破。
实际应用
在实际应用中,该数据集为Unitree G1人形机器人的运动技能习得与部署提供了关键数据支撑。开发者可直接将数据集中的关节轨迹与状态信息导入仿真引擎(如MuJoCo、Isaac Gym),用于训练基于强化学习的行走、避障、搬运等策略,无需从零设计运动参数。同时,其双管道设计(NMR提供平滑运动,GMR提供精确逆向运动学解)允许工程师根据任务需求灵活选择:例如在需要流畅舞蹈展示时优先使用NMR变体,而在需要精确末端轨迹跟踪的操控任务中选用GMR变体。此外,数据集提供的38个身体链接位置信息可直接服务于视觉运动跟踪系统或全身运动规划器,显著缩短了从算法研发到实体机器人部署的迭代周期。
数据集最近研究
最新研究方向
AMASS_Retargeted_for_G1数据集致力于将大规模人体运动捕捉数据库AMASS中的丰富动作迁移至Unitree G1 29自由度人形机器人,为具身智能中的运动重定向研究提供了关键支撑。当前前沿方向聚焦于利用神经运动重定向(NMR)与通用运动重定向(GMR)两条互补技术路线,分别实现基于学习的平滑动作生成和基于逆运动学(IK)的精确运动适配。该数据集推动了人形机器人模仿学习、全身运动控制及仿真到现实迁移等热点领域的突破,尤其在处理复杂动态动作如舞蹈、交互时,其多样性序列覆盖为提升机器人运动自然性与鲁棒性提供了宝贵训练数据,为人形机器人融入真实世界奠定了重要基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作