put_cube_bowl

Hugging Face2025-06-06 更新2025-06-07 收录

下载链接：

https://huggingface.co/datasets/Mohamedal/put_cube_bowl

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学数据集，包含50个剧集，共计22543帧，1个任务，100个视频和1个片段。每个片段包含1000帧，帧率为30fps。数据集使用Apache-2.0许可证，并且是基于LeRobot创建的。数据集的结构包括动作、状态、两个视角的图像信息等，但目前未提供更多具体信息。

创建时间：

2025-06-06

搜集汇总

数据集介绍

构建方式

在机器人操作任务研究领域，put_cube_bowl数据集通过LeRobot平台系统性地采集了50个完整操作序列，共计22543帧多维数据。该数据集采用标准化实验流程，通过SO100型机器人执行立方体放置任务，以30fps同步记录机械臂关节状态、双视角视觉数据及时间戳信息，并以分块存储的Parquet格式保障数据读写效率。

特点

该数据集显著特征在于多模态数据的精密同步与高分辨率采集，包含6自由度关节动作向量、双路480×640像素RGB视频流（顶部与侧视角）及精确的时间对齐元数据。其动作空间涵盖肩部平移/抬升、肘部屈伸、腕部旋转及夹持器开合等完整操作维度，视频数据采用AV1编解码技术确保存储效率与画面质量平衡，为模仿学习提供丰富感知-动作对应关系。

使用方法

研究者可通过加载标准Parquet数据文件获取帧级结构化数据，利用episode_index字段重构完整操作序列。视觉数据支持直接解码为视频流或逐帧分析，动作向量与关节状态数据可直接用于行为克隆或强化学习算法训练。数据集默认提供全部50条序列作为训练集，支持跨模态关联分析、动作预测模型验证等机器人学习任务。

背景与挑战

背景概述

机器人操作任务数据集put_cube_bowl由HuggingFace的LeRobot团队开发，专注于机械臂物体操控领域。该数据集采用so100型机器人平台，包含50个完整操作序列和22543帧多模态数据，通过双视角视觉传感器记录机械臂将立方体放入碗中的精细操作过程。数据集采用Apache 2.0开源协议，为机器人模仿学习与行为克隆算法提供了真实世界的训练基准，推动了家庭服务机器人物体操作能力的发展。

当前挑战

该数据集致力于解决机器人精细操作中的视觉-动作协同挑战，特别是机械臂在非结构化环境中的目标定位与抓取精度问题。构建过程中面临多传感器时序同步、高维连续动作空间标注、以及真实环境光照变化等难题。数据采集需确保双视角视觉流与关节角数据的精确对齐，同时保持操作任务的一致性和可重复性，这对机器人硬件控制精度和数据采集系统的稳定性提出了极高要求。

常用场景

经典使用场景

在机器人操作学习领域，put_cube_bowl数据集通过记录机械臂执行立方体放置任务的完整运动轨迹与多视角视觉数据，为模仿学习算法提供了标准化的训练与评估基准。该数据集典型应用于端到端策略网络的训练，研究者可利用其同步采集的关节角度指令与双摄像头观测数据，构建从视觉感知到动作输出的映射模型。

衍生相关工作

基于该数据集的特性，衍生出多项机器人学习领域的创新研究。包括基于时空注意力的动作预测模型、多视角视觉特征融合框架以及示范数据增强算法。这些工作显著推进了视觉模仿学习在复杂操作任务中的应用深度，为后续构建大规模机器人操作数据集建立了技术范式与处理标准。

数据集最近研究