robocasa_gr1_tabletop_tasks

Hugging Face2025-07-19 更新2025-07-20 收录

下载链接：

https://huggingface.co/datasets/ishika/robocasa_gr1_tabletop_tasks

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个机器人学数据集，包含2235个剧集，共552031帧，分为20个任务。数据集以Parquet格式存储，每个剧集包含动作、完成状态、观测状态、条件、图像、时间戳、帧索引、剧集索引、索引和任务索引等信息。数据集划分为训练集和测试集。

创建时间：

2025-07-19

原始信息汇总

数据集概述

基本信息

名称: robocasa_gr1_tabletop_tasks
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot
创建工具: LeRobot

数据集结构

总任务数: 20
总视频数: 2235
总帧数: 552031
总片段数: 3
片段大小: 1000
帧率: 20 FPS
数据格式: Parquet
数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

数据划分

训练集: 0-1877
测试集: 1877-2235

特征描述

动作特征

名称: action
数据类型: float32
形状: [24]
描述: 24维动作向量

状态特征

名称: observation.state
数据类型: float32
形状: [43]
描述: 包含机器人末端执行器位置、四元数、夹持器位置等信息

条件特征

名称: observation.condition
数据类型: float32
形状: [14]
描述: 包含左右末端执行器的位置和旋转接触条件

图像特征

名称: observation.images.egoview
数据类型: video
形状: [256, 256, 3]
描述: 256x256 RGB视频，帧率20 FPS

其他特征

时间戳: float32
帧索引: int64
片段索引: int64
任务索引: int64

引用信息

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作任务研究领域，robocasa_gr1_tabletop_tasks数据集通过LeRobot框架系统构建，涵盖20种不同桌面任务。数据采集自实际机器人操作环境，总计2235条完整操作序列，以20帧每秒的速率记录多维传感器数据。每条序列被分割为1000帧的块状结构，存储为Parquet格式，确保高效存取与处理。

使用方法

研究者可通过加载标准Parquet文件访问结构化数据，利用预划分的训练集（1877条）与测试集（358条）进行模型验证。视觉数据以MP4格式存储，与动作-状态数据通过帧索引精确对齐。该数据集适用于模仿学习、强化学习等算法开发，支持端到端策略训练与跨任务泛化能力评估。

背景与挑战

背景概述

robocasa_gr1_tabletop_tasks数据集由LeRobot团队基于Apache 2.0许可证构建，专为机器人桌面操作任务设计。该数据集收录了2235个完整操作序列，涵盖20种不同的桌面任务场景，总计超过55万帧多模态数据。其核心研究目标在于推动机器人模仿学习与强化学习算法的发展，通过高精度动作轨迹与多传感器观测数据的融合，为机器人复杂环境下的精细操作提供基准验证平台。数据集采用标准化数据结构，包含机械臂末端位姿、夹持器状态及视觉观测等多维度特征，显著提升了机器人技能学习的可复现性与泛化能力。

当前挑战

该数据集致力于解决机器人桌面操作任务中的动作规划与环境交互难题，其核心挑战在于高维连续动作空间的精确建模与多模态感知数据的对齐融合。构建过程中面临多重技术挑战：需协调双机械臂的协同操作轨迹以保证数据一致性，处理视觉传感器与本体传感器的时空同步问题，以及应对不同桌面物体物理属性带来的动作泛化需求。此外，大规模操作数据的采集需克服真实环境中的硬件误差累积与任务执行中断风险，这对数据采集系统的鲁棒性与数据清洗流程提出了极高要求。

常用场景

经典使用场景

在桌面操作机器人研究领域，robocasa_gr1_tabletop_tasks数据集通过2235个任务片段和55万帧多模态数据，为模仿学习与强化学习算法提供了标准化测试平台。其包含的20种桌面任务场景涵盖物体抓取、位姿调整等精细操作，研究者可基于第一人称视角视频流与24维动作空间数据，训练机械臂执行复杂序列任务。

解决学术问题

该数据集有效解决了机器人操作任务中示范数据稀缺性与泛化能力不足的核心难题。通过提供高精度末端执行器状态、接触条件及视觉观测的同步记录，支持学术界研究跨任务知识迁移、多模态表征学习等关键问题。其结构化数据格式显著降低了机器人学习算法的验证门槛，推动了行为克隆与离线强化学习方法的标准化进程。

实际应用

工业自动化场景中，该数据集支撑的服务机器人可自主完成物流分拣、电子产品组装等桌面级精密操作。医疗领域则应用于手术器械整理、实验室样本处理等标准化流程。家庭服务场景中，基于该数据训练的模型能实现餐具摆放、物品归类等日常任务，显著提升服务机器人的环境适应性与操作可靠性。

数据集最近研究