robocasa_gr1_tabletop_tasks
收藏Hugging Face2025-07-19 更新2025-07-20 收录
下载链接:
https://huggingface.co/datasets/ishika/robocasa_gr1_tabletop_tasks
下载链接
链接失效反馈官方服务:
资源简介:
这是一个机器人学数据集,包含2235个剧集,共552031帧,分为20个任务。数据集以Parquet格式存储,每个剧集包含动作、完成状态、观测状态、条件、图像、时间戳、帧索引、剧集索引、索引和任务索引等信息。数据集划分为训练集和测试集。
创建时间:
2025-07-19
原始信息汇总
数据集概述
基本信息
- 名称: robocasa_gr1_tabletop_tasks
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
- 创建工具: LeRobot
数据集结构
- 总任务数: 20
- 总视频数: 2235
- 总帧数: 552031
- 总片段数: 3
- 片段大小: 1000
- 帧率: 20 FPS
- 数据格式: Parquet
- 数据路径:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频路径:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
数据划分
- 训练集: 0-1877
- 测试集: 1877-2235
特征描述
动作特征
- 名称: action
- 数据类型: float32
- 形状: [24]
- 描述: 24维动作向量
状态特征
- 名称: observation.state
- 数据类型: float32
- 形状: [43]
- 描述: 包含机器人末端执行器位置、四元数、夹持器位置等信息
条件特征
- 名称: observation.condition
- 数据类型: float32
- 形状: [14]
- 描述: 包含左右末端执行器的位置和旋转接触条件
图像特征
- 名称: observation.images.egoview
- 数据类型: video
- 形状: [256, 256, 3]
- 描述: 256x256 RGB视频,帧率20 FPS
其他特征
- 时间戳: float32
- 帧索引: int64
- 片段索引: int64
- 任务索引: int64
引用信息
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人操作任务研究领域,robocasa_gr1_tabletop_tasks数据集通过LeRobot框架系统构建,涵盖20种不同桌面任务。数据采集自实际机器人操作环境,总计2235条完整操作序列,以20帧每秒的速率记录多维传感器数据。每条序列被分割为1000帧的块状结构,存储为Parquet格式,确保高效存取与处理。
使用方法
研究者可通过加载标准Parquet文件访问结构化数据,利用预划分的训练集(1877条)与测试集(358条)进行模型验证。视觉数据以MP4格式存储,与动作-状态数据通过帧索引精确对齐。该数据集适用于模仿学习、强化学习等算法开发,支持端到端策略训练与跨任务泛化能力评估。
背景与挑战
背景概述
robocasa_gr1_tabletop_tasks数据集由LeRobot团队基于Apache 2.0许可证构建,专为机器人桌面操作任务设计。该数据集收录了2235个完整操作序列,涵盖20种不同的桌面任务场景,总计超过55万帧多模态数据。其核心研究目标在于推动机器人模仿学习与强化学习算法的发展,通过高精度动作轨迹与多传感器观测数据的融合,为机器人复杂环境下的精细操作提供基准验证平台。数据集采用标准化数据结构,包含机械臂末端位姿、夹持器状态及视觉观测等多维度特征,显著提升了机器人技能学习的可复现性与泛化能力。
当前挑战
该数据集致力于解决机器人桌面操作任务中的动作规划与环境交互难题,其核心挑战在于高维连续动作空间的精确建模与多模态感知数据的对齐融合。构建过程中面临多重技术挑战:需协调双机械臂的协同操作轨迹以保证数据一致性,处理视觉传感器与本体传感器的时空同步问题,以及应对不同桌面物体物理属性带来的动作泛化需求。此外,大规模操作数据的采集需克服真实环境中的硬件误差累积与任务执行中断风险,这对数据采集系统的鲁棒性与数据清洗流程提出了极高要求。
常用场景
经典使用场景
在桌面操作机器人研究领域,robocasa_gr1_tabletop_tasks数据集通过2235个任务片段和55万帧多模态数据,为模仿学习与强化学习算法提供了标准化测试平台。其包含的20种桌面任务场景涵盖物体抓取、位姿调整等精细操作,研究者可基于第一人称视角视频流与24维动作空间数据,训练机械臂执行复杂序列任务。
解决学术问题
该数据集有效解决了机器人操作任务中示范数据稀缺性与泛化能力不足的核心难题。通过提供高精度末端执行器状态、接触条件及视觉观测的同步记录,支持学术界研究跨任务知识迁移、多模态表征学习等关键问题。其结构化数据格式显著降低了机器人学习算法的验证门槛,推动了行为克隆与离线强化学习方法的标准化进程。
实际应用
工业自动化场景中,该数据集支撑的服务机器人可自主完成物流分拣、电子产品组装等桌面级精密操作。医疗领域则应用于手术器械整理、实验室样本处理等标准化流程。家庭服务场景中,基于该数据训练的模型能实现餐具摆放、物品归类等日常任务,显著提升服务机器人的环境适应性与操作可靠性。
数据集最近研究
最新研究方向
在机器人操作学习领域,robocasa_gr1_tabletop_tasks数据集正推动桌面任务泛化能力的前沿探索。研究者们聚焦于多模态感知与动作预测的融合,利用其丰富的视觉观测和精确的机械臂控制数据,开发能够适应复杂桌面环境的强化学习模型。该数据集支持模仿学习与离线强化学习的结合,促进机器人从人类演示中提取高层策略,同时在真实世界应用中减少试错成本。其高维动作空间和状态表征为跨任务迁移学习提供了坚实基础,正在推动家庭服务机器人向更智能、更灵活的方向发展。
以上内容由遇见数据集搜集并总结生成



