five

robocasa_target_TurnOnMicrowave

收藏
Hugging Face2026-03-28 更新2026-03-29 收录
下载链接:
https://huggingface.co/datasets/BrunoM42/robocasa_target_TurnOnMicrowave
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的,专为机器人技术领域设计,采用Apache-2.0许可证。数据集包含543个 episodes,总计80439帧,所有数据均用于训练。数据以parquet文件格式存储,并包含视频数据,视频分辨率为256x256,帧率为20fps,使用h264编解码器。数据集特征包括机器人手眼视图、代理视图(左右)、状态观察、动作执行、奖励和完成标志等。此外,还包含任务描述和名称的标注。数据集总大小为100MB(数据文件)和200MB(视频文件)。适用于机器人控制、行为学习等相关任务。
创建时间:
2026-03-27
原始信息汇总

数据集概述

基本信息

  • 数据集名称: BrunoM42/robocasa_target_TurnOnMicrowave
  • 创建工具: 使用 LeRobot 创建
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集结构

  • 总任务数: 1
  • 总情节数: 543
  • 总帧数: 80439
  • 数据块大小: 1000
  • 帧率: 20 FPS
  • 数据文件格式: Parquet
  • 视频文件格式: MP4
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB
  • 代码库版本: v3.0
  • 机器人类型: PandaOmron
  • 数据分割: 训练集(0:543)

数据特征

观察特征

  • observation.images.robot0_eye_in_hand: 视频数据,形状为 [256, 256, 3],帧率 20 FPS,编码格式 h264,像素格式 yuv420p,非深度图,无音频。
  • observation.images.robot0_agentview_left: 视频数据,形状为 [256, 256, 3],帧率 20 FPS,编码格式 h264,像素格式 yuv420p,非深度图,无音频。
  • observation.images.robot0_agentview_right: 视频数据,形状为 [256, 256, 3],帧率 20 FPS,编码格式 h264,像素格式 yuv420p,非深度图,无音频。
  • observation.state: 浮点64数据,形状为 [16],帧率 20 FPS。

动作特征

  • action: 浮点64数据,形状为 [12],帧率 20 FPS。

注释特征

  • annotation.human.task_description: 整型64数据,形状为 [1],帧率 20 FPS。
  • annotation.human.task_name: 整型64数据,形状为 [1],帧率 20 FPS。

后续状态特征

  • next.reward: 浮点32数据,形状为 [1],帧率 20 FPS。
  • next.done: 布尔数据,形状为 [1],帧率 20 FPS。

索引与时间戳特征

  • timestamp: 浮点32数据,形状为 [1],帧率 20 FPS。
  • frame_index: 整型64数据,形状为 [1],帧率 20 FPS。
  • episode_index: 整型64数据,形状为 [1],帧率 20 FPS。
  • index: 整型64数据,形状为 [1],帧率 20 FPS。
  • task_index: 整型64数据,形状为 [1],帧率 20 FPS。

文件路径

  • 数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

引用信息

  • 主页: 未提供
  • 论文: 未提供
  • BibTeX 引用: 未提供
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作任务数据集的构建领域,robocasa_target_TurnOnMicrowave数据集通过LeRobot平台精心采集。该数据集聚焦于微波炉开启这一特定家庭任务,利用PandaOmron机器人执行543个独立操作片段,共计80439帧数据。数据以每秒20帧的速率记录,并采用分块存储策略,每块包含1000帧,最终以Parquet格式封装,确保了数据的高效存取与完整性。
特点
该数据集在机器人视觉与状态表征方面展现出显著特点。它提供了多视角的RGB视频流,包括机器人手眼相机及两个代理视角,分辨率均为256x256,编码格式为h264。同时,数据集包含16维的机器人状态向量、12维的动作空间以及奖励、完成标志等强化学习关键信号。这种多维度的数据融合为模仿学习与策略优化提供了丰富的监督信息。
使用方法
对于研究人员而言,该数据集可直接用于训练端到端的机器人操作策略。用户可通过加载Parquet文件访问帧级别的观测、动作及奖励数据,结合配套的MP4视频文件进行视觉验证。数据集已预设训练集划分,涵盖全部543个片段,适用于行为克隆、离线强化学习等算法验证。其标准化的数据结构和清晰的元信息描述,极大便利了在PyTorch或JAX等框架中的快速集成与实验复现。
背景与挑战
背景概述
在机器人学习领域,模拟真实环境中的操作任务对于推动具身智能发展至关重要。robocasa_target_TurnOnMicrowave数据集作为RoboCasa项目的一部分,专注于微波炉开启这一具体家庭操作,旨在为机器人提供多模态交互数据。该数据集由LeRobot平台构建,采用PandaOmron机器人采集,包含543个任务片段与超过8万帧图像,融合了视觉观察、状态信息与动作指令,为研究机器人复杂任务理解与执行提供了结构化资源。其创建反映了学术界对机器人泛化能力与日常技能学习的持续关注,通过开源共享促进了模仿学习与强化学习算法的迭代优化。
当前挑战
该数据集致力于解决机器人操作任务中的泛化性与鲁棒性挑战,尤其在非结构化家庭环境中执行精准动作存在困难。微波炉开启任务涉及物体识别、手柄操控与状态反馈等多个环节,要求算法能够从视觉输入中推断动作序列,并适应物体姿态与场景光照的变化。构建过程中,数据采集需协调多视角相机同步与高维状态记录,确保时序对齐与数据一致性;同时,标注人类任务描述与动作轨迹需平衡效率与准确性,而大规模视频数据的存储与处理也带来了计算资源与传输效率的考验。
常用场景
经典使用场景
在机器人学习领域,robocasa_target_TurnOnMicrowave数据集为模拟家庭环境中的操作任务提供了宝贵资源。该数据集聚焦于开启微波炉这一具体动作,通过PandaOmron机器人采集了543个完整交互序列,包含多视角视觉观测与机器人状态数据。研究人员利用这些时序数据,能够训练模型理解并执行复杂的物体操控任务,尤其在视觉-动作映射与序列决策方面展现出重要价值。
衍生相关工作
围绕该数据集,已衍生出多项专注于机器人操作学习的经典研究工作。这些工作通常涉及视觉运动策略网络的设计、跨任务技能迁移方法的探索,以及基于Transformer的轨迹预测模型。部分研究进一步利用其多视角视频数据,开发了更鲁棒的视觉表征学习技术,为机器人理解复杂场景并执行精细操作奠定了算法基础。
数据集最近研究
最新研究方向
在家庭服务机器人领域,robocasa_target_TurnOnMicrowave数据集聚焦于微波炉开启这一具体任务,为机器人操作技能学习提供了高质量的多模态演示数据。该数据集通过LeRobot平台构建,包含丰富的视觉观测、状态信息和动作序列,正推动模仿学习与强化学习融合的前沿探索。研究者利用其结构化轨迹,致力于开发能够泛化至复杂家居场景的决策模型,同时结合大语言模型进行高层任务规划,以提升机器人在真实环境中的适应性和可靠性。这一方向呼应了具身智能的发展浪潮,为机器人执行日常交互任务奠定了数据基础,具有显著的实用价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作