lerobot_act

Hugging Face2026-05-18 更新2026-05-21 收录

下载链接：

https://huggingface.co/datasets/xBerry/lerobot_act

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot项目创建的机器人演示数据集，旨在为机器人学习任务提供训练数据。数据集包含30个完整的任务执行序列（episodes），总计26,917个数据帧，涉及单一任务。数据以两种形式存储：结构化数据保存在Parquet文件中（总计约100MB），而多视角的机器人操作视频则保存在MP4文件中（总计约200MB），视频帧率为30 FPS。数据集的核心特征包括：1) 动作空间：一个6维浮点向量，控制机器人的肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转和夹爪位置；2) 观测空间：包含机器人的相同6维关节状态，以及来自三个不同相机视角（正面、侧面和名为realsense_45的视角）的RGB图像观测，每个图像的分辨率为480x640像素；3) 元数据：包括时间戳、帧索引、序列索引和任务索引。该数据集适用于机器人模仿学习、行为克隆、离线强化学习等任务的研究与开发。

创建时间：

2026-05-15

搜集汇总

数据集介绍

构建方式

该数据集基于LeRobot框架构建，汇集了30个示范片段，总计26917帧数据，涵盖单一机器人操作任务。数据通过SO-Follower机器人平台采集，利用前视、侧视及Realsense 45度角摄像头同步录制视觉信息，同时记录六维关节空间的动作与状态序列。所有观测数据以30帧/秒的速率存储，并按照1000帧为一个数据块划分为Parquet格式的结构化文件，视频数据则采用AV1编码的MP4格式独立保存。

特点

数据集的核心特色在于其多模态融合的精细设计，同时记录机器人关节位置（涵盖肩部、肘部、腕部及夹爪）的动作指令与状态反馈，形成完整的闭环学习样本。三路640×480分辨率的高清视频流从不同视角捕获环境信息，为模仿学习提供丰富的视觉上下文。数据集包含30个完整示范片段，以标准化格式组织，便于与LeRobot生态系统无缝集成，并通过Apache-2.0许可开源发布，支持学术与工业研究。

使用方法

使用者可通过LeRobot库加载数据，自动完成Parquet与视频文件的批量读取与对齐。数据集默认按全部片段作为训练集划分，支持直接用于行为克隆或离线强化学习算法的模型训练。每个样本包含动作序列、关节状态、多视角图像及时间戳字段，适配模仿学习中的端到端策略学习范式。可视化工具集成在HuggingFace Spaces中，允许用户交互式预览示范片段的时空演变过程，加速数据验证与算法调试。

背景与挑战

背景概述

随着人工智能与机器人技术的深度融合，基于模仿学习的行为克隆方法在机器人操作任务中展现出巨大潜力。lerobot_act数据集由Hugging Face LeRobot团队创建，旨在为机器人操作技能学习提供标准化的数据支持。该数据集基于so_follower机器人平台，采集了30个完整操作回合，包含26,917帧高保真观测数据，涵盖6维关节空间动作指令与多视角视觉信息（正面、侧面及Realsense深度摄像头），帧率达30FPS。作为LeRobot生态系统的重要组成部分，该数据集填补了精细操作技能数据稀缺的空白，为研究动作序列建模与视触觉融合提供了基准测试平台，显著推动了机器人模仿学习领域的发展。

当前挑战

该数据集所解决的领域核心挑战在于为机器人操作中的精细动作模仿提供高质量、多模态的示范数据，克服了传统强化学习方法在复杂操作任务中样本效率低下的问题。然而，数据采集过程中面临显著挑战：首先，机器人系统需保证30个回合操作的动作一致性，避免执行器漂移及相机标定误差；其次，多视角视频（AV1编码）与关节角状态（float32）的高频同步采集对硬件实时性与数据压缩提出了严苛要求；此外，单一任务（单操作类型）的数据规模有限（100MB融合数据与200MB视频），限制了模型泛化到未见过操作场景的能力，亟需扩展到更多任务与灵巧操作场景以提升鲁棒性。

常用场景

经典使用场景

在机器人学习领域，lerobot_act数据集专为模仿学习与行为克隆范式而精心构建，是验证端到端动作预测模型的理想基准。其核心使用场景聚焦于利用高保真视觉与状态信息，驱动机械臂完成精细操作任务。具体而言，研究者可依据同步采集的多视角图像（包括前视、侧视及深度相机视角）与六自由度关节状态，训练模型学习从感知到动作的直接映射关系。该数据集以每秒30帧的高采样率记录了30个完整演示回合，每个样本均包含连续的关节角度动作序列，这为构建时序依赖的隐式行为模型或显式策略网络提供了极具价值的数据基础。

衍生相关工作

围绕lerobot_act数据集已衍生出一系列具有深远影响的经典工作。在算法层面，研究者基于其标准化接口开发了多任务联合训练框架，验证了跨任务共享表征的有效性；在模型架构方面，涌现出融合Transformer与扩散概率模型的先进策略网络，显著提升了长程动作序列的生成质量。此外，该数据集还催生了可迁移特征提取器的预训练范式，使得在源域演示上学习的视觉编码器能通过少量目标域样本实现跨机器人形态的快速适配。这些衍生工作共同推动了机器人学习领域从单一任务复现向通用技能库构建的范式演进。

数据集最近研究