robocasa_target_SeparateFreezerRack

Hugging Face2026-03-29 更新2026-03-30 收录

下载链接：

https://huggingface.co/datasets/BrunoM42/robocasa_target_SeparateFreezerRack

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人学数据集，采用Apache-2.0许可证。数据集包含501个episodes、473,827帧和409个任务，适用于机器人学相关研究。数据以parquet文件和视频形式存储，总数据文件大小为100MB，视频文件大小为200MB。数据集结构包括多个特征：来自不同机器人视角的视频观察（robot0_eye_in_hand、robot0_agentview_left、robot0_agentview_right）、任务描述、状态观察、动作、奖励以及各种索引。视频数据采用h264编码，分辨率为256x256，帧率为20fps。数据集使用PandaOmron机器人收集，包含训练集（0-501 episodes）。该数据集适合用于机器人控制、视觉导航等研究任务。

创建时间：

2026-03-27

原始信息汇总

数据集概述

基本信息

数据集名称： BrunoM42/robocasa_target_SeparateFreezerRack
任务类别： 机器人学
标签： LeRobot
许可证： Apache-2.0
创建工具： 使用 LeRobot 创建

数据集规模

总情节数： 501
总帧数： 473,827
总任务数： 409
数据文件大小： 100 MB
视频文件大小： 200 MB

数据结构

数据格式： Parquet 文件
数据组织： 数据存储在 data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet 路径中
视频组织： 视频存储在 videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4 路径中
块大小： 1000
帧率： 20 FPS
数据划分： 全部数据（0:501）用于训练

数据特征

观测特征

observation.images.robot0_eye_in_hand： 视频数据，形状为 [256, 256, 3]，编码为 H.264，帧率 20 FPS
observation.images.robot0_agentview_left： 视频数据，形状为 [256, 256, 3]，编码为 H.264，帧率 20 FPS
observation.images.robot0_agentview_right： 视频数据，形状为 [256, 256, 3]，编码为 H.264，帧率 20 FPS
observation.state： 浮点数组，形状为 [16]，帧率 20 FPS

动作与奖励特征

action： 浮点数组，形状为 [12]，帧率 20 FPS
next.reward： 浮点数，形状为 [1]，帧率 20 FPS
next.done： 布尔值，形状为 [1]，帧率 20 FPS

标注特征

annotation.human.task_description： 整型数组，形状为 [1]，帧率 20 FPS
annotation.human.task_name： 整型数组，形状为 [1]，帧率 20 FPS

索引与时间特征

timestamp： 浮点数，形状为 [1]，帧率 20 FPS
frame_index： 整型数组，形状为 [1]，帧率 20 FPS
episode_index： 整型数组，形状为 [1]，帧率 20 FPS
index： 整型数组，形状为 [1]，帧率 20 FPS
task_index： 整型数组，形状为 [1]，帧率 20 FPS

其他信息

机器人类型： PandaOmron
代码库版本： v3.0
主页： 信息缺失
论文： 信息缺失
引用信息： 信息缺失

搜集汇总

数据集介绍

构建方式

在机器人操作学习领域，robocasa_target_SeparateFreezerRack数据集依托LeRobot平台构建而成，其核心在于系统化采集真实机器人执行任务的过程数据。该数据集通过PandaOmron机器人平台，在模拟或实际环境中执行了409项独立任务，累计生成501条完整操作序列，并以20帧每秒的速率记录下超过47万帧的时序数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，确保了大规模数据的高效组织与访问，同时辅以MP4格式的视频流，完整保留了机器人手眼相机及全局视角的视觉观测。

使用方法

研究者可通过LeRobot库或直接加载Parquet文件访问该数据集，其统一的数据结构支持端到端的机器人策略学习。数据按时间步组织，每个样本包含当前观测、执行动作、即时奖励、下一观测及回合终止标志，可直接用于训练序列决策模型。视频数据可通过指定路径流式加载，与状态动作数据保持严格同步。数据集目前仅提供训练划分，涵盖全部501条轨迹，适用于行为克隆、离线强化学习等算法验证，亦可用于多视角视觉表征学习及跨任务泛化能力研究。

背景与挑战

背景概述

在机器人学习领域，模拟真实世界复杂操作任务的数据集对于推动具身智能的发展至关重要。robocasa_target_SeparateFreezerRack数据集依托LeRobot平台构建，专注于机器人执行特定目标导向任务的数据收集，例如在家庭或工业场景中操作冰箱货架等精细化动作。该数据集由HuggingFace社区发布，采用Apache 2.0开源许可，旨在为机器人控制、视觉感知与强化学习算法的训练与评估提供高质量、多模态的示范数据。其核心研究问题在于如何通过大规模、结构化的交互数据，提升机器人在非结构化环境中的自主操作能力与泛化性能，从而加速机器人技术在日常生活与服务场景中的实际应用。

当前挑战

该数据集致力于解决机器人操作任务中的两大核心挑战：一是如何使机器人在动态、不确定的真实环境中准确理解并执行复杂的多步骤操作，例如分离冰箱货架这类需要精细手眼协调与空间推理的任务；二是在数据构建过程中，面临高质量多模态数据同步采集的困难，包括视觉观测、机器人状态与动作序列的精确对齐，以及大规模视频数据的高效存储与处理。此外，确保数据集的多样性、覆盖不同任务变体，并维持标注的一致性，亦是构建过程中需要克服的关键技术障碍。

常用场景

经典使用场景

在机器人操作领域，robocasa_target_SeparateFreezerRack数据集为研究复杂环境下的物体操控提供了丰富的实验素材。该数据集聚焦于冰箱货架分离任务，通过PandaOmron机器人采集了多视角视觉观测、状态信息及动作序列，涵盖了501个完整交互片段。这些数据为开发基于模仿学习或强化学习的机器人策略模型奠定了坚实基础，使得研究者能够模拟真实世界中的精细操作场景，推动机器人自主执行日常家务任务的进展。

解决学术问题

该数据集有效应对了机器人学中样本效率低下与泛化能力不足的挑战。通过提供大规模、结构化的交互数据，它支持端到端策略学习方法的验证与优化，有助于解决高维视觉输入到连续动作空间的映射问题。数据集中的多任务标注与丰富观测特征为研究跨任务迁移学习、多模态感知融合等前沿课题提供了实证依据，显著降低了真实机器人实验的成本与风险，加速了智能体在非结构化环境中的适应性研究。

实际应用

robocasa_target_SeparateFreezerRack数据集的实际价值体现在家庭服务机器人的开发与部署中。其模拟的冰箱货架操作场景直接关联到日常生活中的物品整理、仓储管理等需求，为机器人执行精准抓取、避障及序列任务规划提供了测试平台。基于此类数据训练的模型可应用于智能家居、物流分拣乃至医疗辅助设备，提升机器人在复杂动态环境中的可靠性与实用性，推动自动化技术向更广泛的生活场景渗透。

数据集最近研究