GR1-Tabletop-Merged-1000x24
收藏GR1 Tabletop Merged LeRobot Datasets 数据集概述
数据集基本信息
- 许可证:Apache 2.0
- 任务类别:机器人学
- 标签:LeRobot, GR00T, GR1, robocasa, simulation, manipulation
- 数据规模:10K<n<100K
数据集描述
该数据集是来自 NVIDIA PhysicalAI-Robotics-GR00T-X-Embodiment-Sim 集合中 GR1 桌面操作数据集的合并和二次采样版本,格式为 LeRobot v2.0。
数据集变体
| 变体 | 演示/任务 | 任务 | 总情节数 | 总帧数 | 近似大小 |
|---|---|---|---|---|---|
1000x24/ |
1000 | 24个文件夹,186个独特任务 | 24,000 | 6,020,058 | ~40 GB |
300x24/ |
300 | 24个文件夹,186个独特任务 | 7,200 | 1,803,236 | ~12 GB |
100x24/ |
100 | 24个文件夹,185个独特任务 | 2,400 | 602,846 | ~4 GB |
源数据集
原始数据集下载自:nvidia/PhysicalAI-Robotics-GR00T-X-Embodiment-Sim
使用的24个源任务文件夹(每个包含1000个演示):
- 6个 PnP 任务:Bottle→Cabinet, Can→Drawer, Cup→Drawer, Milk→Microwave, Potato→Microwave, Wine→Cabinet
- 18个 PosttrainPnPNovel 任务:物体在不同表面间的各种转移任务(Cuttingboard→{Basket,Cardboardbox,Pan,Pot,Tieredbasket}, Placemat→{Basket,Bowl,Plate,Tieredshelf}, Plate→{Bowl,Cardboardbox,Pan,Plate}, Tray→{Cardboardbox,Plate,Pot,Tieredbasket,Tieredshelf})
处理流程
每个合并数据集的创建步骤:
- 二次采样:从24个任务文件夹中每个随机采样N个情节(种子=42)。
- 合并:将所有采样情节合并为单个数据集,包含:
- 重新索引的情节ID(0到总数-1)
- 跨所有源文件夹的全局重新索引的任务ID
- 更新了
episode_index、task_index和index列的parquet文件 - 合并的
meta/文件(info.json、episodes.jsonl、tasks.jsonl、modality.json)
关于任务数量的说明
100x24 变体有185个独特任务而非186个。这是因为某些任务文件夹包含多个任务变体(例如,PosttrainPnPNovelFromTrayToTieredbasket 文件夹有10个不同的物体变体,如eggplant、tomato等)。“eggplant”变体仅在1000个源情节中的58个里出现,因此当仅随机采样100个情节时,没有选中任何eggplant情节。这是随机二次采样的预期行为。
数据集结构(LeRobot v2.0)
<variant>/ ├── data/ │ └── chunk-000/ │ ├── episode_000000.parquet │ ├── episode_000001.parquet │ └── ... ├── videos/ │ └── chunk-000/ │ └── observation.images.ego_view/ │ ├── episode_000000.mp4 │ ├── episode_000001.mp4 │ └── ... └── meta/ ├── info.json ├── episodes.jsonl ├── tasks.jsonl ├── modality.json ├── stats.json └── relative_stats.json
特征
| 特征 | 类型 | 形状 |
|---|---|---|
observation.images.ego_view |
视频 (h264) | [256, 256, 3] @ 20fps |
observation.state |
float64 | [44] |
action |
float64 | [44] |
timestamp |
float64 | [1] |
next.reward |
float64 | [1] |
next.done |
bool | [1] |
task_index |
int64 | [1] |
episode_index |
int64 | [1] |
annotation.human.coarse_action |
int64 | [1] |
机器人:GR1ArmsAndWaistFourierHands(44自由度:手臂、手、腿、颈部、腰部)
使用方式
python
下载特定变体
from huggingface_hub import snapshot_download
snapshot_download( repo_id="Joocjun/GR1-Tabletop-Merged-LeRobot", repo_type="dataset", allow_patterns="100x24/", # 或 "300x24/" 或 "1000x24/**" local_dir="./gr1_merged" )



