research_pick_up_the_light_brown_rectangular_board

Hugging Face2026-01-09 更新2026-01-10 收录

下载链接：

https://huggingface.co/datasets/Daiki127/research_pick_up_the_light_brown_rectangular_board

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是通过LeRobot创建的机器人学习数据集，包含20个episodes和11620帧数据。数据集包含机器人动作（如shoulder_pan.pos等6个自由度）、状态观察（包括顶部和侧面摄像头视频数据，分辨率480x640，30fps）以及时间戳、帧索引等信息。数据以parquet格式存储，视频以mp4格式存储，总数据量约300MB。

创建时间：

2026-01-08

原始信息汇总

数据集概述

基本信息

数据集名称： research_pick_up_the_light_brown_rectangular_board
创建工具： LeRobot (https://github.com/huggingface/lerobot)
许可证： Apache-2.0
任务类别： 机器人学
标签： LeRobot

数据集结构

配置名称： default
数据文件： data//.parquet
代码库版本： v3.0
机器人类型： so101_follower
总任务数： 1
总情节数： 20
总帧数： 11620
数据块大小： 1000
数据文件大小： 100 MB
视频文件大小： 200 MB
帧率： 30 FPS
数据分割： 训练集 (0:20)

数据特征

动作

数据类型： float32
形状： [6]
名称：
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态

数据类型： float32
形状： [6]
名称：
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测图像（顶部）

数据类型： video
形状： [480, 640, 3]
名称： height, width, channels
视频信息：
- 视频高度：480
- 视频宽度：640
- 视频编解码器：av1
- 视频像素格式：yuv420p
- 是否为深度图：false
- 视频帧率：30
- 视频通道数：3
- 是否包含音频：false

观测图像（侧面）

数据类型： video
形状： [480, 640, 3]
名称： height, width, channels
视频信息：
- 视频高度：480
- 视频宽度：640
- 视频编解码器：av1
- 视频像素格式：yuv420p
- 是否为深度图：false
- 视频帧率：30
- 视频通道数：3
- 是否包含音频：false

其他特征

时间戳： float32, 形状 [1]
帧索引： int64, 形状 [1]
情节索引： int64, 形状 [1]
索引： int64, 形状 [1]
任务索引： int64, 形状 [1]

文件路径

数据路径： data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径： videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

引用信息

主页： [More Information Needed]
论文： [More Information Needed]
BibTeX： [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于真实的物理交互过程。research_pick_up_the_light_brown_rectangular_board数据集通过LeRobot平台，利用so101_follower型机器人执行拾取浅棕色矩形板的单一任务，采集了20个完整交互片段。数据以30帧每秒的频率记录，包含11620帧，并以分块Parquet格式存储，每块约1000帧，确保了数据的高效组织与访问。视频数据采用AV1编码，分别从顶部和侧面视角捕捉480x640分辨率的RGB图像，与机器人的关节位置及动作指令同步对齐，形成了多模态的时序记录。

特点

该数据集的核心特征在于其多模态与高同步性的设计。它同时提供了机器人本体的状态观测与外部视觉感知：状态观测包含肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转及夹爪位置共六个维度的浮点数关节信息；视觉感知则包含顶部与侧面两个固定视角的彩色视频流，帧率与状态数据严格同步。数据集结构清晰，通过帧索引、片段索引等元数据确保了时序的连贯性，所有数据均以标准化格式封装，便于直接用于机器人模仿学习或强化学习算法的训练与评估。

使用方法

为有效利用此数据集，研究者可借助LeRobot或兼容的机器人学习框架进行加载与处理。数据以分块Parquet文件形式组织，可通过指定数据路径模式进行流式读取。典型的使用流程包括：解析特征字典以获取动作、状态观测及图像数据；依据帧索引重建任务执行的完整轨迹；将顶部与侧面的图像序列与对应的关节状态进行对齐，作为感知-动作对的训练样本。该数据集适用于端到端策略学习、行为克隆或作为真实世界机器人操作的仿真基准，其统一的数据结构简化了预处理环节，使研究者能聚焦于算法开发。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习依赖于高质量、结构化的交互数据集以训练智能体执行复杂操作任务。research_pick_up_the_light_brown_rectangular_board数据集应运而生，由HuggingFace的LeRobot项目团队构建，专注于机械臂操作任务的数据收集。该数据集通过so101_follower型机器人采集，包含20个完整交互片段，总计11620帧图像与动作数据，旨在解决机器人灵巧操作中的状态感知与动作生成问题。其多模态特征融合了关节状态、视觉观测与时间序列信息，为机器人控制算法的泛化能力提供了实证基础，推动了具身智能在真实场景中的应用研究。

当前挑战

该数据集致力于解决机器人操作任务中的端到端控制挑战，即如何从多视角视觉输入中学习精确的关节动作序列以完成特定物体抓取。构建过程中面临诸多困难：首先，真实机器人数据采集需克服硬件噪声、环境干扰与动作执行误差，确保数据的一致性与可靠性；其次，多模态数据同步与对齐要求高精度时间戳管理，以避免观测与动作间的时序错位；此外，数据规模有限，仅涵盖单一任务与少量交互片段，可能制约模型在多样化场景与物体属性上的泛化性能。这些挑战共同指向机器人学习数据集的标准化与可扩展性需求。

常用场景

经典使用场景

在机器人操作领域，该数据集通过记录机械臂执行拾取浅棕色矩形板任务的完整交互过程，为模仿学习与强化学习算法提供了丰富的训练资源。其包含多视角视觉观测与关节状态数据，使得研究者能够构建端到端的控制策略，模拟真实世界中的物体抓取与操作场景，从而推动机器人自主执行精细操作任务的能力发展。

解决学术问题

该数据集有效解决了机器人学中关于复杂操作任务的数据稀缺性问题，为研究高维状态空间下的策略泛化与迁移提供了实证基础。通过提供结构化且标注清晰的交互序列，它支持了对动作表示学习、多模态感知融合以及长期任务规划等核心学术问题的深入探索，显著降低了实验门槛并加速了算法迭代进程。

衍生相关工作

围绕该数据集，已衍生出一系列专注于机器人操作学习的经典研究工作，例如基于视觉的模仿学习框架、跨任务策略迁移方法以及实时动作预测模型。这些工作充分利用数据集的多模态特性，在行为克隆、逆强化学习等方向上取得了显著进展，并为后续大规模机器人数据集的构建与标准化提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集