PAI_UE-IsaacSim-Navigation
收藏Physical AI: Unreal Engine - Isaac Sim Navigation Dataset 概述
数据集简介
该数据集展示了Unitree G1人形机器人在程序化生成的室内环境中执行基于视觉的物体导航的演示数据。物理计算由Isaac Sim执行,渲染由Unreal Engine完成。
任务描述
机器人接收前置摄像头图像和指定场景中目标物体的语言指令。它必须结合使用高层速度命令(HLC)和低层关节位置动作(LLC)导航至目标物体。
数据集变体
| 数据集名称 | 情节数 | 描述 |
|---|---|---|
g1_procedural_room_navigation_20260206_062009 |
100 | 每个场景包含5个物体 |
g1_procedural_room_navigation_20260206_080307 |
100 | 每个场景包含1个物体 |
g1_procedural_room_navigation_20260206_095145 |
100 | 每个场景包含3个物体 |
数据集格式
数据集遵循LeRobot v2格式,目录结构如下:
g1_procedural_room_navigation_*/ ├── meta/ │ ├── info.json │ ├── episodes.jsonl │ ├── tasks.jsonl │ ├── modality.json │ └── stats.json ├── data/ │ └── chunk-{NNN}/ │ └── {episode_index:06d}.parquet └── videos/ └── chunk-{NNN}/ └── observation.images.front/ └── episode_{episode_index:06d}.mp4
数据特征
| 特征 | 类型 | 形状 | 描述 |
|---|---|---|---|
observation.images.front |
视频 | (480, 640, 3) | 前置摄像头RGB图像,50 fps |
observation.state.joint_pos |
float32 | (29,) | 关节位置(弧度) |
observation.state.joint_vel |
float32 | (29,) | 关节速度(弧度/秒) |
observation.state.root_pos_w |
float32 | (3,) | 世界坐标系下的根位置 |
observation.state.root_quat_w |
float32 | (4,) | 根朝向四元数 (w, x, y, z) |
observation.state.root_lin_vel_b |
float32 | (3,) | 本体坐标系下的根线速度 |
observation.state.root_ang_vel_b |
float32 | (3,) | 本体坐标系下的根角速度 |
action.hlc_raw |
float32 | (3,) | 原始高层命令 (vx, vy, omega_z) |
action.hlc_processed |
float32 | (3,) | 处理后的HLC(缩放、偏移、裁剪) |
action.llc_raw |
float32 | (29,) | 原始低层关节位置目标 |
action.llc_processed |
float32 | (29,) | 处理后的LLC(围绕默认姿势缩放) |
timestamp |
float64 | (1,) | 自情节开始的时间(秒) |
episode_id |
int64 | (1,) | 情节索引 |
frame_id |
int64 | (1,) | 情节内的帧索引 |
机器人配置
- 模型: Unitree G1
- 关节: 29自由度(腿、腰部、手臂、手腕)
- 关节顺序: IsaacLab约定
- 帧率: 50 FPS
数据集合并
通过运行脚本 demo_data/scripts/combine_datasets.py 可将多个采集会话合并为单个数据集。该操作将:
- 对所有源数据连续重新索引情节(0, 1, ..., N-1)
- 复制更新了
episode_id列的parquet文件 - 将视频文件符号链接至原始文件(不重复)
- 合并
episodes.jsonl并更新索引 - 创建
meta/origin.yaml以跟踪合并的源数据集 - 当总情节数超过
chunks_size时,正确将情节分桶到chunk-NNN/目录
统计信息生成
合并后(或对于任何新数据集),可使用以下命令生成stats.json:
bash
python gr00t/data/stats.py <dataset_path> --embodiment-tag <embodiment-tag>
该脚本计算所有parquet文件中每个特征的统计信息(均值、标准差、最小值、最大值、q01、q99)并写入meta/stats.json。如果具体化配置中配置了相对动作表示,它还会生成meta/relative_stats.json。




