GR1-Tabletop-Merged-100x24
收藏GR1 Tabletop Merged LeRobot Datasets 数据集概述
数据集基本信息
- 许可证:Apache 2.0
- 任务类别:机器人学
- 标签:LeRobot, GR00T, GR1, robocasa, simulation, manipulation
- 数据规模:10K<n<100K
数据集描述
该数据集是来自 NVIDIA PhysicalAI-Robotics-GR00T-X-Embodiment-Sim 集合的 GR1 桌面操作数据集的合并和子采样版本,采用 LeRobot v2.0 格式。
数据集变体
| 变体 | 演示/任务 | 任务 | 总片段数 | 总帧数 | 近似大小 |
|---|---|---|---|---|---|
1000x24/ |
1000 | 24个文件夹,186个唯一任务 | 24,000 | 6,020,058 | ~40 GB |
300x24/ |
300 | 24个文件夹,186个唯一任务 | 7,200 | 1,803,236 | ~12 GB |
100x24/ |
100 | 24个文件夹,185个唯一任务 | 2,400 | 602,846 | ~4 GB |
源数据集
原始逐任务数据集下载自:nvidia/PhysicalAI-Robotics-GR00T-X-Embodiment-Sim
使用的24个源任务文件夹(每个包含1000个演示):
- 6个 PnP 任务:Bottle→Cabinet, Can→Drawer, Cup→Drawer, Milk→Microwave, Potato→Microwave, Wine→Cabinet
- 18个 PosttrainPnPNovel 任务:物体在不同表面间的各种转移任务(Cuttingboard→{Basket,Cardboardbox,Pan,Pot,Tieredbasket}, Placemat→{Basket,Bowl,Plate,Tieredshelf}, Plate→{Bowl,Cardboardbox,Pan,Plate}, Tray→{Cardboardbox,Plate,Pot,Tieredbasket,Tieredshelf})
处理流程
每个合并数据集的创建步骤:
- 子采样:从24个任务文件夹中每个随机采样N个片段(种子=42)
- 合并:将所有采样片段合并为单个数据集,包含:
- 重新索引的片段ID(0至总数-1)
- 跨所有源文件夹的全局重新索引的任务ID
- 更新了
episode_index、task_index和index列的parquet文件 - 合并的
meta/文件(info.json、episodes.jsonl、tasks.jsonl、modality.json)
关于任务数量的说明
100x24 变体有185个唯一任务而非186个。这是因为某些任务文件夹包含多个任务变体(例如,PosttrainPnPNovelFromTrayToTieredbasket 文件夹包含10个不同的物体变体,如茄子、番茄等)。“茄子”变体仅在1000个源片段中的58个中出现,因此当仅随机采样100个片段时,没有选中任何茄子片段。这是随机子采样的预期行为。
数据集结构(LeRobot v2.0)
<variant>/ ├── data/ │ └── chunk-000/ │ ├── episode_000000.parquet │ ├── episode_000001.parquet │ └── ... ├── videos/ │ └── chunk-000/ │ └── observation.images.ego_view/ │ ├── episode_000000.mp4 │ ├── episode_000001.mp4 │ └── ... └── meta/ ├── info.json ├── episodes.jsonl ├── tasks.jsonl ├── modality.json ├── stats.json └── relative_stats.json
特征
| 特征 | 类型 | 形状 |
|---|---|---|
observation.images.ego_view |
视频 (h264) | [256, 256, 3] @ 20fps |
observation.state |
float64 | [44] |
action |
float64 | [44] |
timestamp |
float64 | [1] |
next.reward |
float64 | [1] |
next.done |
bool | [1] |
task_index |
int64 | [1] |
episode_index |
int64 | [1] |
annotation.human.coarse_action |
int64 | [1] |
机器人:GR1ArmsAndWaistFourierHands(44自由度:手臂、手、腿、颈部、腰部)




