push_block_lerobot30

Hugging Face2025-12-07 更新2025-12-08 收录

下载链接：

https://huggingface.co/datasets/Anlorla/push_block_lerobot30

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人技术领域。数据集包含25个episodes，总计2208帧，涉及1个任务。数据以parquet格式存储，视频以mp4格式存储。数据集包含多种特征，如动作（14个关节的控制数据）、观察状态（14个关节的状态数据）、主摄像头和辅助摄像头拍摄的图像（256x256分辨率，3通道，10fps）、时间戳、帧索引、episode索引、任务索引等。数据块大小为1000，帧率为10fps。数据集总大小为100MB（数据文件）和200MB（视频文件）。

创建时间：

2025-12-04

原始信息汇总

数据集概述

基本信息

数据集名称: push_block_lerobot30
创建工具: LeRobot
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集规模

总情节数: 25
总帧数: 2208
总任务数: 1
数据块大小: 1000
帧率: 10 FPS
数据文件总大小: 100 MB
视频文件总大小: 200 MB

数据集结构

数据分割: 训练集（包含所有25个情节）
数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型: float32
形状: [14]
关节命名:
- left_joint_0 至 left_joint_6
- right_joint_0 至 right_joint_6
帧率: 10 FPS

观测状态

数据类型: float32
形状: [14]
关节命名:
- left_joint_0 至 left_joint_6
- right_joint_0 至 right_joint_6
帧率: 10 FPS

观测图像（主摄像头）

数据类型: 视频
形状: [256, 256, 3]
维度命名: 高度、宽度、通道数
视频信息:
- 高度: 256
- 宽度: 256
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 10 FPS
- 通道数: 3
- 包含音频: 否

观测图像（次要摄像头0）

数据类型: 视频
形状: [256, 256, 3]
维度命名: 高度、宽度、通道数
视频信息:
- 高度: 256
- 宽度: 256
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 10 FPS
- 通道数: 3
- 包含音频: 否

观测图像（次要摄像头1）

数据类型: 视频
形状: [256, 256, 3]
维度命名: 高度、宽度、通道数
视频信息:
- 高度: 256
- 宽度: 256
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 10 FPS
- 通道数: 3
- 包含音频: 否

元数据

时间戳: float32, 形状 [1], 帧率 10 FPS
帧索引: int64, 形状 [1], 帧率 10 FPS
情节索引: int64, 形状 [1], 帧率 10 FPS
索引: int64, 形状 [1], 帧率 10 FPS
任务索引: int64, 形状 [1], 帧率 10 FPS

技术细节

代码库版本: v3.0
机器人类型: zeno

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建对于推动模仿学习与强化学习算法的进展至关重要。push_block_lerobot30数据集依托LeRobot平台，通过Zeno机器人执行推块任务采集而成。该数据集包含25个完整的情节，总计2208帧数据，以每秒10帧的速率记录。数据以分块形式存储于Parquet文件中，每块约1000帧，同时配有对应的MP4格式视频文件，确保了动作序列与视觉观测的同步对齐。

特点

该数据集在机器人操作任务中展现出多模态特性，不仅包含14维的关节动作与状态向量，还提供了三路256x256分辨率的RGB视频流，分别对应主视角与两个辅助视角。所有数据均以10Hz频率采样，保证了时序一致性。数据集结构清晰，通过索引字段如帧索引、情节索引等便于追踪数据来源，整体设计兼顾了算法训练所需的丰富观测信息与高效存储需求。

使用方法

研究人员可利用该数据集进行机器人操作策略的学习与验证。数据以标准Parquet格式提供，可直接通过LeRobot工具加载，支持从动作预测到视觉模仿等多种任务。训练时可根据情节索引划分数据，结合关节状态与多视角图像输入，构建端到端的控制模型。视频数据采用AV1编码压缩，在保证质量的同时减少了存储开销，适合大规模分布式训练环境。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的发展亟需高质量、标准化的真实世界交互数据集。push_block_lerobot30数据集应运而生，由HuggingFace的LeRobot项目团队创建，旨在为机器人操作任务提供可复现的基准数据。该数据集聚焦于推动方块这一经典操作任务，通过双机械臂系统记录关节状态、多视角视觉观测及时间戳信息，为研究机器人动作规划与感知控制提供了结构化数据支持。其采用Apache 2.0开源协议，体现了开放科学精神，促进了机器人学习社区的协作创新。

当前挑战

该数据集致力于解决机器人操作任务中动作与感知的联合建模挑战，尤其在复杂物理交互环境下推动物体的精确控制问题。构建过程中面临多重困难：真实世界数据采集需协调机械臂运动与多摄像头同步，确保时间对齐与数据一致性；大规模视频与状态数据的存储与处理对计算资源提出较高要求；此外，数据标注与结构化组织需平衡信息丰富性与访问效率，以支持端到端学习算法的训练与验证。

常用场景

经典使用场景

在机器人操作学习领域，push_block_lerobot30数据集为研究双臂机器人执行物体推动任务提供了宝贵的示范数据。该数据集通过记录机器人关节状态、多视角视觉观测与对应动作序列，构建了从感知到控制的完整交互轨迹。这些数据能够支持模仿学习与强化学习算法的训练，使机器人能够学习如何协调双臂，以稳定且高效地完成推动方块这一基础操作任务。

解决学术问题

该数据集直接应对机器人学习中的示范数据稀缺与多模态对齐问题。它提供了结构化的状态-动作对，有助于解决从高维视觉输入到低维关节控制指令的映射难题。通过包含精确的时间戳与帧索引，数据集支持对时序决策过程的研究，为算法在动态环境中的泛化能力与样本效率提升提供了实证基础，推动了端到端机器人技能学习的发展。

衍生相关工作

围绕此类机器人操作数据集，学术界衍生出诸多经典研究方向。例如，基于示范的模仿学习算法（如行为克隆）可直接利用此类数据进行策略训练。同时，它也为离线强化学习、世界模型构建以及多任务迁移学习提供了基准测试环境。相关研究进一步探索了如何从有限演示中提取技能先验，或结合仿真与真实数据以加速学习进程，不断拓展数据在机器人智能中的价值边界。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集