robocasa_target_PickPlaceCounterToStove

Hugging Face2026-03-28 更新2026-03-29 收录

下载链接：

https://huggingface.co/datasets/BrunoM42/robocasa_target_PickPlaceCounterToStove

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot项目创建，专为机器人技术任务设计。数据集采用Apache-2.0许可协议，主要包含机器人操作相关的视频和特征数据。数据集包含501个episodes，129560帧，覆盖28个不同任务，以20fps的帧率记录。数据以parquet文件格式存储，每个文件约100MB，视频文件约200MB。数据集包含多种观察特征，如机器人手眼视图、代理视图（左右）的视频数据（256x256分辨率，3通道，h264编码），以及状态、动作、奖励等结构化数据。所有特征均以20fps同步记录。数据集适用于机器人学习、行为克隆、强化学习等研究任务，特别适合基于视觉的机器人控制算法开发。

This dataset was developed by the LeRobot project, specifically tailored for robotics-related tasks. Licensed under the Apache-2.0 license, it mainly contains video and feature data associated with robotic manipulation. The dataset comprises 501 episodes and 129,560 frames, covering 28 distinct tasks, and was recorded at a frame rate of 20fps. The data is stored in Parquet format, with each Parquet file being approximately 100MB in size, while the video files are roughly 200MB each. It includes various observation features: video data from robotic eye-in-hand views and agent views (left and right) with a resolution of 256×256, 3 channels, and h.264 encoding, alongside structured data such as states, actions, and rewards. All features are synchronously recorded at 20fps. This dataset is applicable to research tasks including robotics learning, behavior cloning, and reinforcement learning, and is particularly ideal for the development of vision-based robotic control algorithms.

创建时间：

2026-03-27

搜集汇总

数据集介绍

构建方式

在机器人操作任务的数据集构建领域，robocasa_target_PickPlaceCounterToStove数据集依托LeRobot平台，系统性地采集了真实机器人执行拾放操作的过程。该数据集共包含501个完整任务片段，总计129,560帧数据，以每秒20帧的速率记录。数据以分块形式存储，每块约1000帧，采用Parquet格式高效组织观测图像、机器人状态、动作指令及任务标注等多模态信息，确保了数据的结构化和可扩展性。

使用方法

研究人员可通过LeRobot代码库加载该数据集，直接访问分块存储的Parquet文件。数据集已预设训练集划分，涵盖全部501个片段。典型的使用流程包括读取图像观测、状态特征及动作标签，以训练视觉运动策略模型。由于数据包含密集的奖励信号和终止标志，它也适用于离线强化学习算法的验证。数据集的标准化结构允许轻松集成到现有的机器人学习管道中，加速厨房场景下操作技能的研究与开发。

背景与挑战

背景概述

在机器人操作领域，模仿学习与强化学习的发展亟需高质量、大规模的真实世界交互数据作为支撑。robocasa_target_PickPlaceCounterToStove数据集应运而生，它由LeRobot研究团队基于其开源平台构建，旨在为具身智能体提供复杂的多步骤物体操作任务范例。该数据集聚焦于从台面拾取物体并放置至炉灶的特定技能，包含了501条轨迹、超过12万帧的多视角视觉观测与机器人状态及动作数据，其核心研究问题在于如何让机器人泛化地理解并执行涉及环境交互与物体转移的日常任务，对推动家庭服务机器人的实际应用具有重要价值。

当前挑战

该数据集致力于解决机器人操作中长视野、多模态的序列决策挑战，具体任务要求智能体在动态环境中完成精确的拾放操作，这涉及到对物体属性、空间关系以及动作时序的深刻理解。在构建过程中，挑战同样显著：真实机器人数据采集成本高昂，需确保操作的安全性与数据的一致性；多路高清视频与状态数据的同步对齐处理复杂；此外，为涵盖任务的自然变异性并生成有意义的任务描述标注，需要精心设计实验流程与高效的标注机制，这些都对数据集的规模与质量构成了实际约束。

常用场景

经典使用场景

在机器人操作学习领域，robocasa_target_PickPlaceCounterToStove数据集为模拟家庭环境中的物体转移任务提供了丰富的多模态数据。该数据集通过记录机器人从台面拾取物品并放置到炉灶上的完整过程，包含视觉观察、状态信息和动作序列，成为训练端到端机器人策略模型的经典资源。其结构化的视频帧与动作标签使得研究人员能够深入探索基于视觉的强化学习与模仿学习算法在复杂场景中的泛化能力。

解决学术问题

该数据集有效应对了机器人操作中样本效率低下与泛化能力不足的学术挑战。通过提供大规模、高质量的真实机器人交互数据，它支持了从离线强化学习到行为克隆等多种方法的验证与比较。数据集中的多视角视觉输入与精确的动作标注，有助于解决高维观察空间下的策略表示学习问题，推动了机器人操作任务中跨场景、跨物体的适应性研究，为具身智能的发展奠定了数据基础。

实际应用

在实际应用中，robocasa_target_PickPlaceCounterToStove数据集能够直接服务于家庭服务机器人的技能开发。例如，基于该数据训练的模型可以赋能机器人在厨房环境中执行餐具整理、食材摆放等日常操作。数据集所涵盖的物体抓取与放置动作泛化至物流分拣、工业装配等场景，为自动化系统提供了可迁移的操作范例，加速了机器人从实验室演示到真实世界部署的转化进程。

数据集最近研究