lerobot-so101-elevator-6btn-multitask

Hugging Face2026-04-08 更新2026-04-09 收录

下载链接：

https://huggingface.co/datasets/RonLiao/lerobot-so101-elevator-6btn-multitask

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人学数据集，采用Apache-2.0许可证。数据集包含100个episodes，共计24089帧，涉及2种任务。数据以parquet文件格式存储，总大小100MB，配套视频文件总大小500MB，帧率为30fps。数据集仅包含训练集（0:100）。数据特征包括：6维动作空间（肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转、夹持器位置）和相同维度的观测状态；480×640分辨率的前置摄像头RGB视频观测（非深度图）；以及时间戳、帧索引、episode索引和任务索引等元数据。数据集适用于机器人控制与学习相关研究。

创建时间：

2026-04-02

原始信息汇总

数据集概述

基本信息

数据集名称: RonLiao/lerobot-so101-elevator-6btn-multitask
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学

数据集结构

总情节数: 100
总帧数: 24089
总任务数: 2
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 500 MB
帧率: 30 FPS
数据格式: Parquet
视频格式: MP4 (AV1 编码)
数据划分: 训练集 (0:100)

特征字段

action: 浮点32数组，形状[6]，表示机器人关节位置（肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转、夹爪）。
observation.state: 浮点32数组，形状[6]，表示观测状态，内容与action相同。
observation.images.front: 视频数据，形状[480, 640, 3]，表示前置摄像头图像（高度480像素，宽度640像素，3通道），视频编码为AV1，像素格式为yuv420p，非深度图，无音频。
timestamp: 浮点32数组，形状[1]，表示时间戳。
frame_index: 整型64数组，形状[1]，表示帧索引。
episode_index: 整型64数组，形状[1]，表示情节索引。
index: 整型64数组，形状[1]，表示索引。
task_index: 整型64数组，形状[1]，表示任务索引。

文件路径模式

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

元数据

代码库版本: v3.0
机器人类型: so101_follower

引用信息

论文: 未提供
BibTeX: 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于真实世界的交互记录。该数据集通过LeRobot平台，利用so101_follower型机器人执行电梯按钮操作任务，系统采集了多模态交互数据。具体而言，数据采集过程涵盖了100个完整的情节，总计24089帧，以30帧每秒的速率同步记录机器人的关节状态、前视图像及时间戳等信息。数据以分块形式存储于Parquet文件中，每块包含1000帧，确保了高效的数据管理与访问。

特点

该数据集的核心特点在于其多任务与多模态的融合设计。它不仅包含机器人六个自由度的关节位置作为动作与状态观测，还整合了480x640分辨率的前视RGB视频流，提供了丰富的视觉上下文。数据集中明确标注了情节索引、任务索引及帧索引，支持对特定操作序列的精确检索。这种结构化的特征组织，为机器人模仿学习与策略优化研究提供了高质量、可扩展的数据基础。

使用方法

使用该数据集时，研究人员可依据数据路径模式加载指定的Parquet数据块及对应的MP4视频文件。数据集已预分为训练集，涵盖全部100个情节，适用于端到端的机器人行为克隆或强化学习算法训练。通过解析特征字典，可便捷地提取关节动作、状态观测及图像序列，并利用时间戳与索引信息对齐多模态数据流。该设计便于在标准机器学习框架中进行批量加载与预处理，加速机器人控制模型的开发与验证。

背景与挑战

背景概述

在机器人学习领域，模仿学习与多任务强化学习正成为推动机器人泛化能力提升的关键方向。lerobot-so101-elevator-6btn-multitask数据集由HuggingFace的LeRobot项目团队创建，旨在为机器人操作任务提供高质量的多模态示范数据。该数据集聚焦于电梯按钮操作这一具象场景，通过搭载SO101跟随者型机器人的六自由度机械臂，采集包含关节位置、前视图像及时间戳的连续帧序列，以支持端到端策略学习的研究。其设计体现了当前机器人学对于复杂环境交互与多任务泛化的迫切需求，为算法开发提供了结构化的基准测试平台。

当前挑战

该数据集致力于解决机器人多任务操作中的泛化与鲁棒性挑战，尤其在动态非结构化环境下，如何从有限的示范中学习可迁移的策略是一大难题。构建过程中，数据采集面临传感器同步、动作标注一致性以及多模态信息对齐等技术障碍，同时需确保示范轨迹在任务维度上的多样性与覆盖度。此外，数据集的规模与任务复杂性之间的平衡，以及真实世界噪声对模型训练的影响，均是实现高效模仿学习所需克服的核心挑战。

常用场景

经典使用场景

在机器人学习领域，lerobot-so101-elevator-6btn-multitask数据集为多任务强化学习提供了关键支持。该数据集通过记录机械臂在电梯按钮操作场景中的状态与动作序列，结合视觉感知数据，典型应用于训练端到端的机器人控制策略。研究者能够利用其丰富的关节位置、图像帧及时间戳信息，构建模仿学习或离线强化学习模型，以优化机械臂在复杂环境中的决策能力，推动机器人自主执行精细化操作任务的进展。

解决学术问题

该数据集有效应对了机器人学中多任务泛化与样本效率低下的核心挑战。通过提供结构化、多模态的演示数据，它支持学者探索如何从有限的人类示范中学习可迁移的技能，从而减少对大量交互数据的依赖。其意义在于为机器人控制算法的验证与比较建立了标准化基准，促进了模仿学习、行为克隆及离线强化学习等方法的创新，加速了智能体在现实场景中适应未知任务的研究进程。

衍生相关工作

围绕该数据集，学术界已衍生出多项经典研究工作，主要集中在机器人多任务学习与视觉运动策略的融合方面。例如，研究者利用其构建了基于Transformer的序列预测模型，以统一处理关节控制与视觉输入；同时，也有工作探索了分层强化学习框架，将按钮操作任务分解为子技能进行学习。这些成果不仅丰富了机器人学习的方法论，还为后续数据集如LeRobot系列的扩展与优化提供了重要参考，形成了持续迭代的研究生态。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集