five

robocasa_target_TurnOffStove

收藏
Hugging Face2026-03-28 更新2026-03-29 收录
下载链接:
https://huggingface.co/datasets/BrunoM42/robocasa_target_TurnOffStove
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot创建,采用Apache-2.0许可证,专注于机器人技术领域。数据集包含PandaOmron机器人的500个任务片段,总计114027帧数据,涵盖8种不同任务。数据以20帧每秒的速率采集,并以1000帧为一个块进行存储。数据集仅包含训练集。数据内容包括机器人手眼摄像头、左右视角摄像头的视频数据(256x256分辨率,H.264编码,YUV420P格式),以及任务描述、任务名称、机器人状态(16维)、动作(12维)、奖励、完成标志、时间戳、帧索引、片段索引、索引和任务索引等结构化数据。数据文件以parquet格式存储,视频文件以mp4格式存储,总数据量为100MB,视频文件为200MB。
创建时间:
2026-03-27
原始信息汇总

数据集概述

基本信息

  • 数据集名称: BrunoM42/robocasa_target_TurnOffStove
  • 创建工具: 使用LeRobot创建
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集规模

  • 总情节数: 500
  • 总帧数: 114,027
  • 总任务数: 8
  • 数据块大小: 1000
  • 帧率: 20 FPS
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB

数据划分

  • 训练集: 包含全部500个情节(索引范围:0:500)

数据结构与特征

数据存储为Parquet文件,视频存储为MP4文件。

观察特征

  • observation.images.robot0_eye_in_hand: 视频数据,形状为[256, 256, 3],编码为h264,像素格式为yuv420p,非深度图,无音频。
  • observation.images.robot0_agentview_left: 视频数据,形状为[256, 256, 3],编码为h264,像素格式为yuv420p,非深度图,无音频。
  • observation.images.robot0_agentview_right: 视频数据,形状为[256, 256, 3],编码为h264,像素格式为yuv420p,非深度图,无音频。
  • observation.state: 浮点数组,形状为[16],帧率为20 FPS。

动作与标注特征

  • action: 浮点数组,形状为[12],帧率为20 FPS。
  • annotation.human.task_description: 整型数组,形状为[1],帧率为20 FPS。
  • annotation.human.task_name: 整型数组,形状为[1],帧率为20 FPS。

元数据与索引特征

  • next.reward: 浮点数组,形状为[1],帧率为20 FPS。
  • next.done: 布尔数组,形状为[1],帧率为20 FPS。
  • timestamp: 浮点数组,形状为[1],帧率为20 FPS。
  • frame_index: 整型数组,形状为[1],帧率为20 FPS。
  • episode_index: 整型数组,形状为[1],帧率为20 FPS。
  • index: 整型数组,形状为[1],帧率为20 FPS。
  • task_index: 整型数组,形状为[1],帧率为20 FPS。

文件路径模式

  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

代码库与机器人信息

  • 代码库版本: v3.0
  • 机器人类型: PandaOmron

引用信息

  • 主页: 未提供
  • 论文: 未提供
  • BibTeX引用格式: 未提供
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作学习领域,robocasa_target_TurnOffStove数据集依托LeRobot平台构建,专注于模拟家庭环境中关闭炉灶的特定任务。数据采集过程涉及PandaOmron机器人执行500个完整操作序列,总计114,027帧图像,以20帧每秒的速率记录。观测数据包含机器人手眼视角与左右全局视角的三通道视频,均以256x256分辨率编码存储,同时整合了16维状态向量与12维动作指令,辅以任务描述与奖励信号,形成结构化的序列决策记录。
特点
该数据集以多模态感知与精细动作标注为显著特征,提供机器人手部嵌入式视觉与双路全局视角的同步视频流,确保环境交互的立体表征。数据维度涵盖连续状态空间与离散任务索引,每帧均关联时间戳与回合标识,支持端到端的策略学习与行为克隆研究。其数据组织采用分块存储机制,将大规模序列分割为千帧单元,平衡了存储效率与访问性能,适用于长时程任务的分析与建模。
使用方法
研究人员可通过加载Parquet格式的数据文件,直接访问分块存储的观测、动作与奖励序列,利用帧索引与回合标识实现特定任务片段的提取。数据集兼容主流强化学习框架,支持以20赫兹的时序分辨率重建机器人操作轨迹,用于训练视觉运动策略或评估模仿学习算法。视频流可通过指定路径解码,结合状态与动作数据,能够复现关闭炉灶任务的完整决策过程,为家庭服务机器人的技能泛化提供实证基础。
背景与挑战
背景概述
在机器人学习领域,面向家庭环境的操作任务一直是研究热点,旨在推动服务机器人在复杂场景中的实际应用。robocasa_target_TurnOffStove数据集由LeRobot团队构建,专注于关炉灶这一具体家务操作,其核心研究问题在于如何通过多模态感知与动作序列学习,使机器人能够安全、准确地完成涉及热源的危险性任务。该数据集收录了500个任务片段,包含超过11万帧图像及机器人状态数据,采用PandaOmron机械臂平台,以20帧每秒的速率采集手眼视角与全局视角的视觉信息,为模仿学习与强化学习算法提供了丰富的训练资源,对提升机器人在非结构化环境中的操作能力具有显著推动作用。
当前挑战
该数据集致力于解决家庭环境中机器人操作任务的挑战,特别是关炉灶这类涉及高温物体与精细动作的复杂问题。其核心挑战在于如何从高维视觉输入中提取有效特征,并生成精确、安全的动作序列,同时需应对环境光照变化、物体遮挡以及动作时序依赖等不确定性因素。在构建过程中,数据采集面临诸多困难,包括确保机器人操作的安全性以避免损坏设备或引发危险,同步多摄像头视频流与机器人状态数据的技术复杂性,以及标注大规模时序动作与任务描述的繁重工作。此外,数据集的规模与多样性仍需扩展,以覆盖更广泛的炉灶类型与操作场景,增强模型的泛化能力。
常用场景
经典使用场景
在机器人操作领域,robocasa_target_TurnOffStove数据集为模拟家庭环境中的炉灶关闭任务提供了丰富的演示数据。该数据集通过PandaOmron机器人采集了500个任务片段,包含多视角视觉观测、机器人状态和动作序列,为模仿学习与强化学习算法提供了标准化的训练与评估平台。研究人员能够利用这些数据训练模型理解复杂操作序列,例如精准识别炉灶开关并执行安全关闭动作,从而推动机器人自主执行日常家务任务的进展。
实际应用
在实际应用层面,robocasa_target_TurnOffStove数据集直接服务于家庭服务机器人的开发与优化。基于该数据集训练的模型能够被部署于智能家居系统,实现自动化安全监控,例如在检测到无人看管时自动关闭炉灶,预防火灾风险。此外,这些技术可扩展至养老辅助或残疾人生活支持场景,帮助完成烹饪后的清理工作,提升生活自主性与安全性,体现了机器人技术在民生领域的实用价值。
衍生相关工作
围绕该数据集,衍生了一系列经典研究工作,主要集中在视觉-动作策略学习与多任务泛化方面。例如,基于模仿学习的基准方法被广泛用于复现炉灶关闭任务,而后续研究则扩展至跨任务迁移学习,利用数据集中的多任务结构训练统一策略模型。这些工作不仅验证了数据集的可靠性,还推动了如LeRobot等开源机器人平台的算法迭代,为更复杂的家庭操作任务奠定了技术基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作