research_pick_up_the_yellow_cube

Hugging Face2026-01-09 更新2026-01-10 收录

下载链接：

https://huggingface.co/datasets/Daiki127/research_pick_up_the_yellow_cube

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人技术领域。包含20个episodes，11641帧数据，涉及1个任务。数据以parquet格式存储，包含动作（6个关节位置）、观测状态（6个关节位置）、图像（侧面和顶部视角，分辨率480x640，30fps）、时间戳、帧索引、episode索引等信息。视频数据使用AV1编解码器，无音频。

创建时间：

2026-01-07

原始信息汇总

数据集概述

基本信息

数据集名称: research_pick_up_the_yellow_cube
创建工具: LeRobot (https://github.com/huggingface/lerobot)
任务类别: 机器人学
标签: LeRobot
许可证: Apache 2.0
主页: [More Information Needed]
论文: [More Information Needed]

数据集统计

代码库版本: v3.0
机器人类型: so101_follower
总情节数: 20
总帧数: 11641
总任务数: 1
数据块大小: 1000
数据文件大小: 100 MB
视频文件大小: 200 MB
帧率: 30 FPS
数据分割: 训练集 (0:20)

数据结构

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型: float32
形状: [6]
名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测状态

数据类型: float32
形状: [6]
名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测图像（侧视）

数据类型: video
形状: [480, 640, 3]
名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

观测图像（俯视）

数据类型: video
形状: [480, 640, 3]
名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

其他特征

timestamp: 数据类型 float32，形状 [1]
frame_index: 数据类型 int64，形状 [1]
episode_index: 数据类型 int64，形状 [1]
index: 数据类型 int64，形状 [1]
task_index: 数据类型 int64，形状 [1]

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作领域，高质量的数据集对于推动模仿学习与强化学习算法的进步至关重要。research_pick_up_the_yellow_cube数据集依托LeRobot平台构建，通过so101_follower型机器人执行拾取黄色立方体的单一任务，系统采集了20个完整操作片段。数据以30帧每秒的速率记录，涵盖机器人关节状态、动作指令及多视角视觉信息，并以分块Parquet格式高效存储，确保了数据的时序完整性与结构清晰度。

使用方法

研究人员可利用该数据集进行机器人模仿学习或离线强化学习模型的训练与验证。数据以分块Parquet文件形式提供，可通过标准数据加载流程读取，并利用帧索引等信息重构完整的操作序列。侧视与俯视的双路视频可作为视觉编码器的输入，结合关节状态与动作标签，能够训练端到端的策略网络或进行行为克隆。数据集已预设训练划分，支持开箱即用的模型开发流程。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的研究依赖于高质量、结构化的真实世界交互数据。research_pick_up_the_yellow_cube数据集应运而生，由HuggingFace的LeRobot项目团队构建，旨在为机械臂操作任务提供基准数据。该数据集聚焦于“拾取黄色立方体”这一经典操作任务，通过集成多视角视觉观测与关节状态信息，记录了机器人执行抓取动作的完整序列。其设计初衷在于推动机器人技能学习的可复现性研究，为算法开发与性能评估提供标准化资源，从而加速机器人自主操作能力的进步。

当前挑战

该数据集致力于解决机器人操作任务中的模仿学习与策略泛化挑战，其核心问题在于如何从有限的演示数据中学习鲁棒且可迁移的控制策略。构建过程中面临多重挑战：首先，真实世界数据采集需协调机器人硬件同步与传感器校准，确保多模态数据的时间对齐与空间一致性；其次，任务设计需平衡场景复杂性与数据多样性，以涵盖操作过程中的状态变化与干扰因素；此外，数据标注与结构化处理要求高效流程，以生成大规模、高质量的轨迹数据，支持端到端学习模型的训练与验证。

常用场景

经典使用场景

在机器人操作学习领域，该数据集以其丰富的多模态数据为特色，记录了机械臂执行拾取黄色立方体任务的完整过程。经典使用场景聚焦于模仿学习与强化学习算法的训练与验证，研究者利用数据集中的关节位置、图像观测及动作序列，构建端到端的控制策略模型，旨在实现机器人对特定物体的精准抓取与放置。通过反复实验与优化，该数据集为算法性能评估提供了标准化的基准环境。

解决学术问题

该数据集有效解决了机器人学中关于复杂操作任务样本稀缺的学术难题，为模仿学习、视觉伺服控制及多模态感知融合研究提供了高质量的真实世界数据。其意义在于降低了机器人技能学习的实验门槛，促进了数据驱动方法在机械臂操控中的广泛应用，推动了从仿真到实际场景的过渡研究，对提升机器人自主操作能力具有深远影响。

实际应用

在实际应用层面，该数据集可直接服务于工业自动化与仓储物流场景，例如指导机械臂完成分拣、装配等精细操作。基于数据集训练的模型能够适应真实环境中的物体识别与抓取任务，提升生产线的灵活性与效率，同时为服务机器人开发提供技术支撑，助力实现更智能的物理交互系统。

数据集最近研究