PH2D
收藏数据集概述
数据集名称
Humanoid Policy ~ Human Policy
数据集简介
该数据集包含用于训练以自我为中心(即不使用手腕摄像头)的人形机器人操作策略的代码库。数据集主要关注核心组件,并提供了少量封装。
数据集结构
assets: 机器人URDF文件和网格cet: 用于回放/推出策略的Mujoco仿真环境,用于代码开发和添加新的实现configs: 机器人和仿真环境的配置文件data: 数据占位符,包含一些可视化脚本docs: 文档hdt: 主要学习框架sim_test (legacy): 遗留的ALOHA立方体转移测试,作为完整性检查的虚拟示例
支持的算法
- ACT(可选择使用ResNet、DinoV2和CLIP骨干网络)
- Vanilla DP(基于官方Colab)
- RDT(训练器可用,但未经测试)
数据集下载
数据集在HuggingFace上开源,包含以下内容:
- 许多人类在多样化的野外场景中执行论文中描述的任务
- 位于UCSD和CMU的两个Unitree H1人形机器人,通过远程操作收集
- 一个在Mujoco中的Unitree H1人形机器人,通过远程操作收集
下载数据的命令: bash cd data/recordings bash download_data.sh
数据可视化
提供了脚本来检查下载数据中的动作和视觉观察: bash cd data/ python plot_keypoints.py python plot_visual_obs.py
数据格式转换
提供了将自定义的人类/人形数据转换为该数据集格式的指南:
data/plot_keypoints.py: 3D可视化人类中心表示docs/humanoid_mujoco.md: 在Mujoco中回放处理后的数据,确保表示对齐hdt/constants.py: 人类中心表示的元素解释
训练
以Mujoco中的玩具人形操作数据和简单的ACT策略为例,启动单GPU训练: bash python main.py --chunk_size 100 --batch_size 64 --num_epochs 50000 --lr 1e-4 --seed 0 --exptid mujoco_sim_test_resnet_100cs --dataset_json_path configs/datasets/mujoco_sim.json --model_cfg_path configs/models/act_resnet.yaml --no_wandb
策略回放
在Mujoco/真实机器人中回放训练和追踪的策略: bash cd ../cet python mujoco_rollout_replay.py --hdf_file_path ../data/recordings/processed/1061new_sim_pepsi_grasp_h1_2_inspire-2025_02_11-22_20_48/processed_episode_0.hdf5 --norm_stats_path ../hdt/mujoco_sim_test_resnet_100cs/dataset_stats.pkl --plot --model_path ../hdt/mujoco_sim_test_resnet_100cs/policy_traced.pt --tasktype pepsi --chunk_size 100 --policy_config_path ../hdt/configs/models/act_resnet.yaml
待办事项
- 添加远程操作脚本以收集更多Mujoco数据
- 缓解Mujoco仿真回放中已知的“粘性手指”摩擦问题
- 更新使用相机支架和脚本收集人类数据的详细说明




