lerobot-dataset

Hugging Face2026-04-19 更新2026-04-20 收录

下载链接：

https://huggingface.co/datasets/divyansh35dk/lerobot-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot项目创建，主要用于机器人技术领域。数据集包含23个episodes，总计13215帧，涉及2个任务。数据以parquet文件和视频文件形式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集包含多个特征，如动作状态（包括6个关节位置）、观察状态（同样包括6个关节位置）、来自腕部和顶部摄像头的图像（分辨率480x640，3通道），以及时间戳、帧索引、episode索引等。数据集采用Apache-2.0许可证，适用于机器人控制、行为克隆等任务。

创建时间：

2026-04-18

原始信息汇总

数据集概述

基本信息

数据集名称: lerobot-dataset
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学

数据集结构

总任务数: 2
总情节数: 23
总帧数: 13215
帧率: 30 FPS
数据文件大小: 100 MB
视频文件大小: 200 MB
分块大小: 1000
数据分割: 训练集 (0:23)
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型: float32
形状: [6]
维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测状态

数据类型: float32
形状: [6]
维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测图像（腕部摄像头）

数据类型: 视频
形状: [480, 640, 3]
维度名称: 高度, 宽度, 通道数
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30
- 通道数: 3
- 包含音频: 否

观测图像（顶部摄像头）

数据类型: 视频
形状: [480, 640, 3]
维度名称: 高度, 宽度, 通道数
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30
- 通道数: 3
- 包含音频: 否

元数据

时间戳: float32, 形状 [1]
帧索引: int64, 形状 [1]
情节索引: int64, 形状 [1]
索引: int64, 形状 [1]
任务索引: int64, 形状 [1]

可视化

可视化工具: https://huggingface.co/spaces/lerobot/visualize_dataset?path=divyansh35dk/lerobot-dataset

引用信息

主页: [More Information Needed]
论文: [More Information Needed]
BibTeX引用: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集对于模型训练至关重要。lerobot-dataset依托LeRobot平台构建，通过记录机器人执行任务过程中的多模态数据形成结构化资源。该数据集包含23个完整任务片段，总计13215帧数据，以每秒30帧的速率采集。数据以分块形式存储于Parquet文件中，每块约1000帧，便于高效读取与处理。视频数据采用AV1编码，分辨率统一为640x480，确保了视觉信息的清晰度与一致性。

使用方法

使用该数据集时，研究者可通过Hugging Face平台直接访问并加载Parquet格式的结构化数据。数据集已预分为训练集，包含全部23个任务片段，适合用于端到端的机器人策略学习。在具体应用中，可结合动作序列、关节状态观测及双视角图像，训练视觉-动作映射模型。数据的分块存储方式支持流式加载，适合大规模分布式训练，而配套的视频文件则可单独调用，用于可视化分析或生成任务演示。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据集对于推动模仿学习与强化学习算法的实际应用至关重要。LeRobot数据集由HuggingFace社区基于LeRobot开源框架构建，专注于收集机器人执行任务时的多模态交互数据。该数据集记录了机器人关节状态、视觉观察及动作指令，旨在为机器人策略学习提供丰富的训练资源。尽管其具体创建时间与核心研究团队信息尚未公开，但数据集的结构设计体现了对机器人操作任务泛化能力研究的深入关切，有望促进开源机器人学习生态的发展。

当前挑战

LeRobot数据集致力于解决机器人模仿学习中的策略泛化与多模态感知融合问题，其挑战在于如何从有限的真实世界交互片段中提取可迁移的技能表示。在构建过程中，数据采集面临机器人硬件控制一致性、多视角视频同步与高维连续动作空间记录的技术难题。此外，数据标注与任务划分需要精细设计以确保学习信号的清晰性，而数据规模相对有限可能制约复杂长时程任务的建模能力。

常用场景

经典使用场景

在机器人学习领域，lerobot-dataset以其丰富的多模态数据为机器人模仿学习提供了经典范例。该数据集整合了机械臂的关节状态、视觉观测以及时序动作信息，尤其适用于训练端到端的机器人控制策略。研究者能够利用其包含的腕部和顶部摄像头视频流，结合六自由度关节位置数据，构建从感知到动作的映射模型，从而在仿真或真实环境中实现精准的任务执行。

解决学术问题

该数据集有效应对了机器人模仿学习中数据稀缺与多模态对齐的挑战。通过提供结构化的动作-观测对序列，它支持了基于深度学习的策略泛化研究，解决了传统方法在复杂场景下适应性不足的问题。其意义在于推动了数据驱动机器人控制的发展，为探索样本效率、跨任务迁移等核心议题奠定了实证基础，显著提升了学术社区对真实世界机器人学习的理解深度。

实际应用

在实际机器人部署中，lerobot-dataset可直接应用于工业自动化与家庭服务机器人的技能学习。例如，基于数据集中机械臂抓取与操作的轨迹记录，能够训练模型完成装配、分拣等重复性任务。视觉与状态数据的结合，使得机器人能在动态环境中实时调整动作，提升作业的鲁棒性与安全性，为智能制造与个性化辅助提供了可靠的技术支撑。

数据集最近研究