research_pick_up_the_thick_light_green_rectangular_board

Hugging Face2026-01-09 更新2026-01-10 收录

下载链接：

https://huggingface.co/datasets/Daiki127/research_pick_up_the_thick_light_green_rectangular_board

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人数据集。它包含与机器人动作和观察相关的片段、帧和任务，包括状态数据以及从顶部和侧面视角拍摄的图像。数据集以parquet文件格式组织，并包含具有特定特征和元数据的视频数据。

创建时间：

2026-01-08

原始信息汇总

数据集概述

基本信息

数据集名称: research_pick_up_the_thick_light_green_rectangular_board
托管地址: https://huggingface.co/datasets/Daiki127/research_pick_up_the_thick_light_green_rectangular_board
任务类别: 机器人学
标签: LeRobot
许可证: Apache-2.0
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集规模与结构

代码库版本: v3.0
机器人类型: so101_follower
总情节数: 20
总帧数: 11519
总任务数: 2
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据分割: 训练集 (0:20)
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型: float32
形状: [6]
维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测状态

数据类型: float32
形状: [6]
维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测图像（顶部）

数据类型: video
形状: [480, 640, 3]
维度名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 是否包含音频: false

观测图像（侧面）

数据类型: video
形状: [480, 640, 3]
维度名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 是否包含音频: false

元数据

时间戳: 数据类型 float32，形状 [1]
帧索引: 数据类型 int64，形状 [1]
情节索引: 数据类型 int64，形状 [1]
索引: 数据类型 int64，形状 [1]
任务索引: 数据类型 int64，形状 [1]

引用信息

主页: 信息缺失
论文: 信息缺失
BibTeX引用: 信息缺失

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于真实的物理交互过程。research_pick_up_the_thick_light_green_rectangular_board数据集通过LeRobot平台，利用so101_follower型机器人采集了20个完整操作片段，共计11519帧数据。这些数据以30帧每秒的速率记录，涵盖了两种不同的任务场景。原始数据被分割为每1000帧一个块，并以Parquet格式存储，同时配有从顶部和侧面视角拍摄的AV1编码视频，确保了数据的高效压缩与完整性。

特点

该数据集在机器人学习领域展现出鲜明的多模态特性。它不仅包含了六维关节位置的动作与状态向量，还融合了双视角的视觉信息，每个视频帧的分辨率达到480x640像素。数据结构层次清晰，通过时间戳、帧索引和任务索引等元数据，支持对操作序列的精确追溯。所有数据均采用标准化格式，便于直接用于模仿学习或强化学习算法的训练，为复杂操作任务的建模提供了丰富的感知与运动信息。

使用方法

为有效利用该数据集进行机器人技能学习，研究者可借助LeRobot提供的工具链直接加载Parquet文件及关联视频。数据按训练集划分，涵盖了全部20个片段，适用于端到端的策略训练。在模型构建时，可同步处理关节状态序列与双路视频流，以学习从视觉观察到动作输出的映射关系。由于数据已预先分块并标注了任务索引，便于进行特定任务的针对性实验或跨任务的泛化能力评估。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的研究依赖于高质量、结构化的真实世界交互数据。research_pick_up_the_thick_light_green_rectangular_board数据集应运而生，由HuggingFace的LeRobot项目团队创建，旨在为机器人操作任务提供可复现的基准数据。该数据集聚焦于机械臂执行物体抓取与操控的核心研究问题，特别是针对厚实浅绿色矩形板这一特定对象的拾取操作。通过集成多视角视觉观测、关节状态与动作指令的同步记录，该数据集为开发与评估端到端的机器人控制策略提供了关键资源，推动了现实场景中机器人灵巧操作能力的进步。

当前挑战

该数据集致力于解决机器人操作中复杂物体抓取的领域挑战，要求模型从高维视觉与状态输入中理解物理交互并生成精确的关节控制序列。构建过程中面临多重挑战：真实世界数据采集需协调机器人硬件同步、确保传感器校准精度，并处理光照变化与物体位姿不确定性；数据标注与对齐需将多路视频流、状态信号与动作标签在时间维度上精确匹配；此外，数据规模有限与任务多样性不足可能制约模型的泛化能力，而高效存储与读取大规模视频序列也带来了工程上的复杂性。

常用场景

经典使用场景

在机器人操作领域，该数据集通过记录机械臂执行拾取厚绿色矩形板的动作序列，为模仿学习与行为克隆提供了标准化的实验平台。其包含多视角视频流与关节状态数据，使得研究人员能够训练模型从视觉输入中推断出精确的运动控制策略，从而模拟人类操作员的抓取行为。

解决学术问题

该数据集有效解决了机器人操作中视觉-运动映射的泛化难题，为研究多模态感知下的动作预测提供了实证基础。通过整合高维视觉观测与低维关节指令，它促进了端到端策略学习的发展，降低了手工设计特征的需求，推动了基于深度学习的机器人控制方法的进步。

衍生相关工作

基于该数据集的结构化多模态数据，衍生出了多项关于视觉伺服控制与强化学习结合的研究。例如，利用其视频流进行时空特征提取的工作，促进了跨视角动作迁移模型的创新；同时，其提供的精确状态-动作对也为离线强化学习算法的验证与比较奠定了数据基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集