lerobot_pp_green_brick_2

Hugging Face2025-11-21 更新2025-11-22 收录

下载链接：

https://huggingface.co/datasets/KeisukeSato1024/lerobot_pp_green_brick_2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学领域的数据集，包含了一个名为LeRobot的机器人执行任务的相关数据。数据集共有120个剧集，107501帧图像，分为一个训练集。数据集以Parquet文件格式存储，并包含了相应的视频文件。每个剧集包含了机器人的动作、状态、前后摄像头图像等信息。数据集的许可为Apache-2.0。

创建时间：

2025-11-20

原始信息汇总

KeisukeSato1024/lerobot_pp_green_brick_2 数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集规模

总任务数: 1
总回合数: 120
总帧数: 107501
数据块大小: 1000
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS

数据结构

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
训练集划分: 0:120

数据特征

动作特征

名称: action
数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

状态观测

名称: observation.state
数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测

前视摄像头

名称: observation.images.front
数据类型: 视频
分辨率: 480×640×3
视频编码: AV1
像素格式: yuv420p
帧率: 30 FPS
音频: 无
深度图: 否

侧视摄像头

名称: observation.images.side
数据类型: 视频
分辨率: 480×640×3
视频编码: AV1
像素格式: yuv420p
帧率: 30 FPS
音频: 无
深度图: 否

索引特征

时间戳: float32 [1]
帧索引: int64 [1]
回合索引: int64 [1]
数据索引: int64 [1]
任务索引: int64 [1]

技术信息

代码库版本: v3.0
机器人类型: so101_follower

搜集汇总

数据集介绍

构建方式

在机器人技术领域，数据集的构建方式直接影响其科学价值与应用潜力。lerobot_pp_green_brick_2数据集通过LeRobot平台系统采集，采用SO101型跟随机器人执行单一任务场景，共收录120个完整交互片段，累计107501帧时序数据。数据以分块存储技术组织，每1000帧构成一个标准化单元，通过Parquet格式高效保存关节位姿、图像流及时间戳等多模态信息，形成结构化机器人操作记录。

使用方法

针对机器人行为克隆与策略学习的研究需求，该数据集支持端到端的训练流程。研究者可通过解析Parquet文件直接获取关节空间动作指令与对应的视觉观察序列，利用帧间连续性构建状态-动作映射关系。双路视频流可作为多视角视觉编码器的输入，而时间戳与索引系统便于实现长时序任务的分段采样。数据集完全采用Apache 2.0开源协议，允许研究者自由进行模型训练、微调及跨模态表征学习等实验探索。

背景与挑战

背景概述

在机器人学习领域，高质量示范数据的稀缺性长期制约着策略泛化能力的发展。lerobot_pp_green_brick_2数据集由HuggingFace的LeRobot项目团队构建，聚焦于机械臂操作任务的示教学习。该数据集通过SO101型跟随机器人采集了120个完整操作序列，包含十万余帧多模态观测数据，其核心价值在于提供了关节空间动作与双视角视觉观测的精确对齐，为模仿学习与强化学习算法提供了真实世界的物理交互基准。

当前挑战

该数据集致力于解决机器人精细操作任务中的动作规划难题，其核心挑战在于高维连续动作空间与视觉感知的跨模态对齐。构建过程中面临多传感器时序同步的技术瓶颈，需确保六自由度关节指令与双路视频流在毫秒级精度下的数据一致性。此外，大规模物理交互数据的采集效率与存储优化亦构成显著挑战，需平衡高清视频流压缩质量与实时控制数据的完整性。

常用场景

经典使用场景

在机器人学习领域，lerobot_pp_green_brick_2数据集以其丰富的多模态数据记录，为机器人操作任务的研究提供了典型范例。该数据集通过整合六自由度机械臂的关节位置控制指令、双视角视觉观测及时间序列信息，构建了完整的机器人交互环境。研究人员可基于此开展模仿学习与强化学习算法的训练与验证，尤其适用于分析复杂操作场景中感知与动作的协同机制。

解决学术问题

该数据集有效应对了机器人学习中的若干关键挑战，包括高维连续动作空间的策略优化、多传感器数据融合的表示学习，以及长时序任务的样本效率提升。通过提供标准化的大规模真实机器人交互数据，显著降低了机器人算法研究的硬件门槛，为验证新型学习范式提供了可靠基准。其结构化存储格式与完整元数据描述，进一步促进了机器人学习领域的可复现性研究。

实际应用

在工业自动化与智能服务机器人领域，该数据集支撑的操作技能迁移研究具有重要应用价值。基于数据集训练的模型可适配于物流分拣、精密装配等场景，通过视觉-动作映射实现自主操作。其双视角视觉系统设计尤其适用于需要环境感知的复杂任务，为开发适应非结构化环境的智能机器人系统提供了数据支撑。

数据集最近研究