robocasa_target_WaffleReheat

Hugging Face2026-03-29 更新2026-03-30 收录

下载链接：

https://huggingface.co/datasets/BrunoM42/robocasa_target_WaffleReheat

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学相关数据集，使用LeRobot创建。数据集采用apache-2.0许可证，主要面向机器人技术领域。数据集包含500个episodes，共计420,489帧，涉及1个任务类型。数据以20fps的帧率采集，使用PandaOmron机器人完成。数据集结构包括存储在parquet文件中的数据和mp4格式的视频。特征包括来自机器人不同视角的视频观察（robot0_eye_in_hand、robot0_agentview_left、robot0_agentview_right）、任务描述、任务名称、状态观察、动作、奖励、完成标志、时间戳、帧索引、episode索引和任务索引。数据文件总大小为100MB，视频文件总大小为200MB。数据集适用于机器人控制、行为学习等相关研究任务。

创建时间：

2026-03-27

原始信息汇总

数据集概述

基本信息

数据集名称： BrunoM42/robocasa_target_WaffleReheat
任务类别： 机器人学
标签： LeRobot
许可证： Apache-2.0
创建工具： 使用LeRobot创建

数据集规模

总任务数： 1
总情节数： 500
总帧数： 420,489
数据块大小： 1000
帧率： 20 FPS
数据文件总大小： 100 MB
视频文件总大小： 200 MB

数据划分

训练集： 包含所有500个情节（索引0:500）

数据结构与特征

数据存储为Parquet文件，路径模式为：data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet 视频存储为MP4文件，路径模式为：videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

图像观测

observation.images.robot0_eye_in_hand： 视频数据，形状(256, 256, 3)，帧率20 FPS，编码H.264，像素格式yuv420p，非深度图，无音频
observation.images.robot0_agentview_left： 视频数据，形状(256, 256, 3)，帧率20 FPS，编码H.264，像素格式yuv420p，非深度图，无音频
observation.images.robot0_agentview_right： 视频数据，形状(256, 256, 3)，帧率20 FPS，编码H.264，像素格式yuv420p，非深度图，无音频

状态与动作

observation.state： 浮点数组，形状(16,)，帧率20 FPS
action： 浮点数组，形状(12,)，帧率20 FPS

标注信息

annotation.human.task_description： 整型数组，形状(1,)，帧率20 FPS
annotation.human.task_name： 整型数组，形状(1,)，帧率20 FPS

元数据与索引

next.reward： 浮点数组，形状(1,)，帧率20 FPS
next.done： 布尔数组，形状(1,)，帧率20 FPS
timestamp： 浮点数组，形状(1,)，帧率20 FPS
frame_index： 整型数组，形状(1,)，帧率20 FPS
episode_index： 整型数组，形状(1,)，帧率20 FPS
index： 整型数组，形状(1,)，帧率20 FPS
task_index： 整型数组，形状(1,)，帧率20 FPS

技术信息

代码库版本： v3.0
机器人类型： PandaOmron

引用信息

主页： 未提供
论文： 未提供
BibTeX引用： 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作学习领域，robocasa_target_WaffleReheat数据集依托LeRobot框架构建，采用PandaOmron机器人平台进行数据采集。该数据集通过记录机器人执行特定任务的过程，系统性地收集了500个完整交互片段，涵盖超过42万帧的多模态数据。数据以20帧每秒的速率同步采集，并以分块存储于Parquet格式文件中，确保了大规模时序数据的高效组织与访问。

使用方法

研究者可通过LeRobot工具链直接加载该数据集，利用其标准化的数据接口访问多模态流。数据集按训练划分组织，每个数据块包含同步的时间戳、帧索引与任务标识，支持端到端的策略学习流程。用户可并行读取视觉观测、机器人状态及动作指令，结合奖励信号与终止标志构建训练样本，适用于行为克隆、离线强化学习等算法验证，其模块化设计便于集成到现有机器人学习框架中。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的研究日益依赖于大规模、高质量的真实世界交互数据。robocasa_target_WaffleReheat数据集应运而生，由LeRobot项目团队构建，旨在为家庭环境中的机器人操作任务提供丰富的多模态演示数据。该数据集聚焦于华夫饼复热这一具体任务，通过PandaOmron机器人采集了500条轨迹，共计超过42万帧的视觉与状态信息，涵盖了手眼相机与全局视角的双目图像，以及机器人的状态与动作序列。其核心研究问题在于如何利用真实交互数据提升机器人对复杂物体操作与任务泛化的能力，为机器人学习算法的训练与评估提供了宝贵的资源，推动了家庭服务机器人向更智能、更灵巧的方向发展。

当前挑战

该数据集致力于解决家庭环境中机器人执行精细化操作任务的挑战，例如处理可变形的食物对象、应对复杂的环境交互以及实现高精度的动作控制。在构建过程中，团队面临多重技术难题：采集大规模真实机器人交互数据需要克服硬件同步、传感器校准与数据存储的效率瓶颈；确保多模态数据（如高帧率视频与机器人状态）的时间对齐与一致性涉及复杂的系统工程；标注任务描述与名称以支持语义理解也增加了人工成本。此外，处理如华夫饼复热这类涉及热力学变化与物体形变的任务，对数据的真实性与多样性提出了更高要求，这些挑战共同塑造了数据集的构建难度与应用价值。

常用场景

经典使用场景

在机器人操作学习领域，robocasa_target_WaffleReheat数据集以其丰富的多视角视觉观测和动作序列，为机器人执行复杂家庭任务提供了经典范例。该数据集聚焦于华夫饼再加热这一具体操作，通过PandaOmron机器人采集了500个完整交互片段，包含手眼摄像头与外部视角的高清视频流，以及精确的关节状态与动作数据。研究者能够利用这些时序对齐的多模态数据，训练机器人理解并模仿人类在厨房环境中的精细操作流程，从而推动机器人从感知到执行的端到端学习框架的发展。

解决学术问题

该数据集有效应对了机器人模仿学习中缺乏大规模、高质量真实世界操作数据的核心挑战。它提供了结构化、标注清晰的动作-观测对序列，使得研究人员能够深入探究视觉-运动策略的泛化能力、多任务学习的迁移机制，以及强化学习在稀疏奖励环境下的样本效率问题。通过解决这些基础性学术难题，数据集为构建能够在非结构化家庭环境中可靠执行长期任务的智能体奠定了坚实的数据基础，显著提升了机器人自主操作研究的可复现性与可比性。

实际应用

robocasa_target_WaffleReheat数据集直接服务于家庭服务机器人的实际开发与部署。其蕴含的华夫饼再加热任务流程，是家庭早餐准备场景的典型缩影，能够指导机器人学习安全操作微波炉、识别食物状态、进行灵巧抓取与放置等关键技能。基于此数据集训练的模型，有望集成到未来的家用机器人系统中，实现自动化食品加热与准备，减轻日常家务负担，提升生活便利性，并推动服务机器人从实验室演示走向真实家庭环境的落地应用。

数据集最近研究