GR1-Tabletop-Merged-1000x24

Name: GR1-Tabletop-Merged-1000x24
Creator: Joocjun
Published: 2026-03-31 19:34:32
License: 暂无描述

Hugging Face2026-03-31 更新2026-03-31 收录

下载链接：

https://huggingface.co/datasets/Joocjun/GR1-Tabletop-Merged-1000x24

下载链接

链接失效反馈

官方服务：

资源简介：

GR1桌面合并LeRobot数据集是从NVIDIA的'PhysicalAI-Robotics-GR00T-X-Embodiment-Sim'集合中合并和子采样的GR1桌面操作数据集，格式化为LeRobot v2.0格式。数据集包含三个变体：'1000x24/'、'300x24/'和'100x24/'，分别有不同的演示/任务比例、任务数量、总片段数和总帧数。数据集来源于24个源任务文件夹，包括6个PnP任务和18个PosttrainPnPNovel任务。数据集经过子采样和合并处理，具有特定的结构和特征，如视频、状态、动作等。数据集的使用和下载方法也在README中详细说明。

提供机构：

Joocjun

创建时间：

2026-03-18

原始信息汇总

GR1 Tabletop Merged LeRobot Datasets 数据集概述

数据集基本信息

许可证：Apache 2.0
任务类别：机器人学
标签：LeRobot, GR00T, GR1, robocasa, simulation, manipulation
数据规模：10K<n<100K

数据集描述

该数据集是来自 NVIDIA PhysicalAI-Robotics-GR00T-X-Embodiment-Sim 集合中 GR1 桌面操作数据集的合并和二次采样版本，格式为 LeRobot v2.0。

数据集变体

变体	演示/任务	任务	总情节数	总帧数	近似大小
`1000x24/`	1000	24个文件夹，186个独特任务	24,000	6,020,058	~40 GB
`300x24/`	300	24个文件夹，186个独特任务	7,200	1,803,236	~12 GB
`100x24/`	100	24个文件夹，185个独特任务	2,400	602,846	~4 GB

源数据集

原始数据集下载自：nvidia/PhysicalAI-Robotics-GR00T-X-Embodiment-Sim

使用的24个源任务文件夹（每个包含1000个演示）：

6个 PnP 任务：Bottle→Cabinet, Can→Drawer, Cup→Drawer, Milk→Microwave, Potato→Microwave, Wine→Cabinet
18个 PosttrainPnPNovel 任务：物体在不同表面间的各种转移任务（Cuttingboard→{Basket,Cardboardbox,Pan,Pot,Tieredbasket}, Placemat→{Basket,Bowl,Plate,Tieredshelf}, Plate→{Bowl,Cardboardbox,Pan,Plate}, Tray→{Cardboardbox,Plate,Pot,Tieredbasket,Tieredshelf}）

处理流程

每个合并数据集的创建步骤：

二次采样：从24个任务文件夹中每个随机采样N个情节（种子=42）。
合并：将所有采样情节合并为单个数据集，包含：
- 重新索引的情节ID（0到总数-1）
- 跨所有源文件夹的全局重新索引的任务ID
- 更新了 episode_index、task_index 和 index 列的parquet文件
- 合并的 meta/ 文件（info.json、episodes.jsonl、tasks.jsonl、modality.json）

关于任务数量的说明

100x24 变体有185个独特任务而非186个。这是因为某些任务文件夹包含多个任务变体（例如，PosttrainPnPNovelFromTrayToTieredbasket 文件夹有10个不同的物体变体，如eggplant、tomato等）。“eggplant”变体仅在1000个源情节中的58个里出现，因此当仅随机采样100个情节时，没有选中任何eggplant情节。这是随机二次采样的预期行为。

数据集结构（LeRobot v2.0）

<variant>/ ├── data/ │ └── chunk-000/ │ ├── episode_000000.parquet │ ├── episode_000001.parquet │ └── ... ├── videos/ │ └── chunk-000/ │ └── observation.images.ego_view/ │ ├── episode_000000.mp4 │ ├── episode_000001.mp4 │ └── ... └── meta/ ├── info.json ├── episodes.jsonl ├── tasks.jsonl ├── modality.json ├── stats.json └── relative_stats.json

特征

特征	类型	形状
`observation.images.ego_view`	视频 (h264)	[256, 256, 3] @ 20fps
`observation.state`	float64	[44]
`action`	float64	[44]
`timestamp`	float64	[1]
`next.reward`	float64	[1]
`next.done`	bool	[1]
`task_index`	int64	[1]
`episode_index`	int64	[1]
`annotation.human.coarse_action`	int64	[1]

机器人：GR1ArmsAndWaistFourierHands（44自由度：手臂、手、腿、颈部、腰部）

使用方式

python

下载特定变体

from huggingface_hub import snapshot_download

snapshot_download( repo_id="Joocjun/GR1-Tabletop-Merged-LeRobot", repo_type="dataset", allow_patterns="100x24/", # 或 "300x24/" 或 "1000x24/**" local_dir="./gr1_merged" )

5,000+

优质数据集

54 个

任务类型

进入经典数据集