five

robocasa_target_WaffleReheat

收藏
Hugging Face2026-03-29 更新2026-03-30 收录
下载链接:
https://huggingface.co/datasets/BrunoM42/robocasa_target_WaffleReheat
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人学相关数据集,使用LeRobot创建。数据集采用apache-2.0许可证,主要面向机器人技术领域。数据集包含500个episodes,共计420,489帧,涉及1个任务类型。数据以20fps的帧率采集,使用PandaOmron机器人完成。数据集结构包括存储在parquet文件中的数据和mp4格式的视频。特征包括来自机器人不同视角的视频观察(robot0_eye_in_hand、robot0_agentview_left、robot0_agentview_right)、任务描述、任务名称、状态观察、动作、奖励、完成标志、时间戳、帧索引、episode索引和任务索引。数据文件总大小为100MB,视频文件总大小为200MB。数据集适用于机器人控制、行为学习等相关研究任务。
创建时间:
2026-03-27
原始信息汇总

数据集概述

基本信息

  • 数据集名称: BrunoM42/robocasa_target_WaffleReheat
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 许可证: Apache-2.0
  • 创建工具: 使用LeRobot创建

数据集规模

  • 总任务数: 1
  • 总情节数: 500
  • 总帧数: 420,489
  • 数据块大小: 1000
  • 帧率: 20 FPS
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB

数据划分

  • 训练集: 包含所有500个情节(索引0:500)

数据结构与特征

数据存储为Parquet文件,路径模式为:data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet 视频存储为MP4文件,路径模式为:videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

图像观测

  • observation.images.robot0_eye_in_hand: 视频数据,形状(256, 256, 3),帧率20 FPS,编码H.264,像素格式yuv420p,非深度图,无音频
  • observation.images.robot0_agentview_left: 视频数据,形状(256, 256, 3),帧率20 FPS,编码H.264,像素格式yuv420p,非深度图,无音频
  • observation.images.robot0_agentview_right: 视频数据,形状(256, 256, 3),帧率20 FPS,编码H.264,像素格式yuv420p,非深度图,无音频

状态与动作

  • observation.state: 浮点数组,形状(16,),帧率20 FPS
  • action: 浮点数组,形状(12,),帧率20 FPS

标注信息

  • annotation.human.task_description: 整型数组,形状(1,),帧率20 FPS
  • annotation.human.task_name: 整型数组,形状(1,),帧率20 FPS

元数据与索引

  • next.reward: 浮点数组,形状(1,),帧率20 FPS
  • next.done: 布尔数组,形状(1,),帧率20 FPS
  • timestamp: 浮点数组,形状(1,),帧率20 FPS
  • frame_index: 整型数组,形状(1,),帧率20 FPS
  • episode_index: 整型数组,形状(1,),帧率20 FPS
  • index: 整型数组,形状(1,),帧率20 FPS
  • task_index: 整型数组,形状(1,),帧率20 FPS

技术信息

  • 代码库版本: v3.0
  • 机器人类型: PandaOmron

引用信息

  • 主页: 未提供
  • 论文: 未提供
  • BibTeX引用: 未提供
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作学习领域,robocasa_target_WaffleReheat数据集依托LeRobot框架构建,采用PandaOmron机器人平台进行数据采集。该数据集通过记录机器人执行特定任务的过程,系统性地收集了500个完整交互片段,涵盖超过42万帧的多模态数据。数据以20帧每秒的速率同步采集,并以分块存储于Parquet格式文件中,确保了大规模时序数据的高效组织与访问。
使用方法
研究者可通过LeRobot工具链直接加载该数据集,利用其标准化的数据接口访问多模态流。数据集按训练划分组织,每个数据块包含同步的时间戳、帧索引与任务标识,支持端到端的策略学习流程。用户可并行读取视觉观测、机器人状态及动作指令,结合奖励信号与终止标志构建训练样本,适用于行为克隆、离线强化学习等算法验证,其模块化设计便于集成到现有机器人学习框架中。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习的研究日益依赖于大规模、高质量的真实世界交互数据。robocasa_target_WaffleReheat数据集应运而生,由LeRobot项目团队构建,旨在为家庭环境中的机器人操作任务提供丰富的多模态演示数据。该数据集聚焦于华夫饼复热这一具体任务,通过PandaOmron机器人采集了500条轨迹,共计超过42万帧的视觉与状态信息,涵盖了手眼相机与全局视角的双目图像,以及机器人的状态与动作序列。其核心研究问题在于如何利用真实交互数据提升机器人对复杂物体操作与任务泛化的能力,为机器人学习算法的训练与评估提供了宝贵的资源,推动了家庭服务机器人向更智能、更灵巧的方向发展。
当前挑战
该数据集致力于解决家庭环境中机器人执行精细化操作任务的挑战,例如处理可变形的食物对象、应对复杂的环境交互以及实现高精度的动作控制。在构建过程中,团队面临多重技术难题:采集大规模真实机器人交互数据需要克服硬件同步、传感器校准与数据存储的效率瓶颈;确保多模态数据(如高帧率视频与机器人状态)的时间对齐与一致性涉及复杂的系统工程;标注任务描述与名称以支持语义理解也增加了人工成本。此外,处理如华夫饼复热这类涉及热力学变化与物体形变的任务,对数据的真实性与多样性提出了更高要求,这些挑战共同塑造了数据集的构建难度与应用价值。
常用场景
经典使用场景
在机器人操作学习领域,robocasa_target_WaffleReheat数据集以其丰富的多视角视觉观测和动作序列,为机器人执行复杂家庭任务提供了经典范例。该数据集聚焦于华夫饼再加热这一具体操作,通过PandaOmron机器人采集了500个完整交互片段,包含手眼摄像头与外部视角的高清视频流,以及精确的关节状态与动作数据。研究者能够利用这些时序对齐的多模态数据,训练机器人理解并模仿人类在厨房环境中的精细操作流程,从而推动机器人从感知到执行的端到端学习框架的发展。
解决学术问题
该数据集有效应对了机器人模仿学习中缺乏大规模、高质量真实世界操作数据的核心挑战。它提供了结构化、标注清晰的动作-观测对序列,使得研究人员能够深入探究视觉-运动策略的泛化能力、多任务学习的迁移机制,以及强化学习在稀疏奖励环境下的样本效率问题。通过解决这些基础性学术难题,数据集为构建能够在非结构化家庭环境中可靠执行长期任务的智能体奠定了坚实的数据基础,显著提升了机器人自主操作研究的可复现性与可比性。
实际应用
robocasa_target_WaffleReheat数据集直接服务于家庭服务机器人的实际开发与部署。其蕴含的华夫饼再加热任务流程,是家庭早餐准备场景的典型缩影,能够指导机器人学习安全操作微波炉、识别食物状态、进行灵巧抓取与放置等关键技能。基于此数据集训练的模型,有望集成到未来的家用机器人系统中,实现自动化食品加热与准备,减轻日常家务负担,提升生活便利性,并推动服务机器人从实验室演示走向真实家庭环境的落地应用。
数据集最近研究
最新研究方向
在机器人操作领域,robocasa_target_WaffleReheat数据集聚焦于家庭环境下的精细任务执行,其最新研究围绕多模态学习与模仿学习的深度融合展开。该数据集提供了丰富的视觉观测数据与动作序列,研究者正探索如何利用这些数据训练端到端的策略模型,以提升机器人在复杂场景中的泛化能力。结合近期大语言模型在机器人任务规划中的突破,该数据集被用于验证视觉-语言-动作联合表征的有效性,推动具身智能向更灵活、更适应真实世界交互的方向演进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作