Grab-the-red-lego-v4

Hugging Face2025-08-02 更新2025-08-03 收录

下载链接：

https://huggingface.co/datasets/borisedestein/Grab-the-red-lego-v4

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot创建，包含50个视频，每个视频包含多个帧，总共74925帧。数据集的结构包括动作、状态观测、正面图像等多种特征。所有数据以parquet格式存储，并遵循apache-2.0许可。

创建时间：

2025-08-02

原始信息汇总

数据集概述

基本信息

名称: Grab-the-red-lego-v4
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集描述

创建工具: LeRobot
主页: 无提供
论文: 无提供

数据集结构

配置名称: default
数据文件: data//.parquet
元数据文件: meta/info.json

元数据详情

代码库版本: v2.1
机器人类型: so101_follower
总集数: 50
总帧数: 74925
总任务数: 1
总视频数: 50
总块数: 1
块大小: 1000
帧率: 30 fps
分割: 训练集 (0:50)

数据路径

数据路径模板: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径模板: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观察状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观察图像 (observation.images.front)
- 数据类型: video
- 形状: [1080, 1920, 3]
- 名称: height, width, channels
- 视频信息:
  - 高度: 1080
  - 宽度: 1920
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 帧率: 30 fps
  - 通道数: 3
  - 是否有音频: false
其他特征
- 时间戳 (timestamp): float32, 形状 [1]
- 帧索引 (frame_index): int64, 形状 [1]
- 集索引 (episode_index): int64, 形状 [1]
- 索引 (index): int64, 形状 [1]
- 任务索引 (task_index): int64, 形状 [1]

引用

BibTeX: 无提供

搜集汇总

数据集介绍

构建方式

在机器人操作任务研究领域，Grab-the-red-lego-v4数据集通过LeRobot框架系统性地采集了真实机械臂操作数据。该数据集包含50个完整操作序列，总计74925帧高精度时序数据，以30Hz频率同步记录六自由度机械臂关节角度状态、前视角1080p高清视频流及时间戳信息。数据以分块存储的Parquet格式组织，确保了高效读写与大规模时序数据的完整性。

特点

本数据集的核心特征体现在多模态数据的精密同步与结构化封装。动作空间涵盖六维连续关节控制量，观测空间同时包含机械臂状态向量与高清视觉感知流，形成闭环控制所需的完备状态表征。所有数据帧均附带精确的时间戳与序列索引，支持端到端模仿学习与强化学习算法的训练。视频流采用AV1编码压缩，在保证视觉质量的同时显著降低存储开销。

使用方法

研究者可通过LeRobot代码库加载该数据集，利用标准化的数据接口访问多模态时序流。每个数据样本包含同步的动作-观测对，支持滑动窗口采样构建训练批次。典型应用包括行为克隆、视觉运动策略学习与时空特征提取，数据集内置的帧索引机制便于实现长时序依赖建模。Parquet格式支持分布式加载，适用于大规模深度学习训练流程。

背景与挑战

背景概述

机器人操作任务数据集Grab-the-red-lego-v4由LeRobot研究团队构建，专注于机械臂抓取红色乐高积木的精细化操作。该数据集采集自so101_follower型机器人平台，包含50个完整操作序列共计74925帧高分辨率视觉-动作配对数据，以30fps的采样频率记录了六自由度机械臂的关节角度与前端摄像头观测信息。此类数据集为模仿学习与强化学习算法提供了真实世界的操作范例，推动了机器人精细操作能力的发展。

当前挑战

该数据集旨在解决机器人视觉-动作协同中的精确抓取问题，其核心挑战在于高维连续动作空间与视觉观测的语义对齐，以及跨模态时序数据的一致性保持。构建过程中需克服机械臂轨迹平滑性保障、多传感器数据同步采集、以及动态环境下红色目标物的稳定识别等技术难点，同时需确保操作演示的成功率与数据质量的统一性。

常用场景

经典使用场景

在机器人操作学习领域，Grab-the-red-lego-v4数据集主要应用于机械臂抓取任务的模仿学习与强化学习算法验证。该数据集通过记录六自由度机械臂执行红色乐高积木抓取操作的全过程，包含关节角度、末端执行器状态及高清视觉观测数据，为研究者提供了完整的动作-状态对应关系。其经典使用场景包括端到端策略网络训练、行为克隆算法评估以及多模态感知与控制联合建模研究。

实际应用

在工业自动化与家庭服务机器人领域，该数据集支撑的算法可直接应用于物品分拣、精密装配等实际场景。基于数据驱动的抓取策略能够适应不同光照条件与物体位姿变化，显著提升机械臂在非结构化环境中的操作鲁棒性。相关技术已延伸至物流仓储的包裹处理、电子元件的精密安装等需要高精度抓取的应用场景，降低了传统示教编程的人力成本。

衍生相关工作

该数据集催生了多项机器人学习领域的创新研究，包括基于时空注意力的动作预测模型、多视角视觉特征融合框架以及示范数据增强技术。研究者利用其丰富的多模态特性开发了分层强化学习架构，实现了从原始像素到关节控制指令的端到端映射。相关成果进一步推动了元学习在机器人操作任务中的应用，为少样本技能迁移提供了重要基准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集