five

libero_10_lerobot

收藏
Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://huggingface.co/datasets/oorbt/libero_10_lerobot
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集基于openVLA的LIBERO原始数据集,使用LeRobot创建。数据集采用apache-2.0许可证,属于机器人学领域。数据集包含379个片段,总计101469帧,覆盖10个任务。数据文件大小为100MB,视频文件大小为200MB,帧率为10fps。数据集结构包括多个特征字段,如观察图像(256x256x3)、状态(8维浮点数)、动作(7维浮点数)以及时间戳、帧索引、片段索引等。数据以parquet格式存储,适用于机器人学相关的研究和应用。
创建时间:
2026-04-23
原始信息汇总

数据集概述:libero_10_lerobot

该数据集基于 LeRobot 框架创建,源自 openVLA 提供的原始 LIBERO 数据集,专注于机器人操作任务。

基本信息

  • 许可证:Apache-2.0
  • 机器人类型:Panda(弗兰卡·艾米卡机械臂)
  • 任务类别:机器人学(Robotics)

数据集规模

  • 总片段数:379 个
  • 总帧数:101,469 帧
  • 总任务数:10 个
  • 数据文件大小:100 MB
  • 视频文件大小:200 MB
  • 帧率:10 FPS
  • 分块大小:1000

数据划分

  • 训练集:全部 379 个片段(索引 0 至 378)

数据结构

数据集包含以下特征字段:

  1. 观测图像(observation.images)

    • image:视频类型,尺寸 (256, 256, 3),编码为 AV1,10 FPS
    • image2:视频类型,尺寸 (256, 256, 3),编码为 AV1,10 FPS
  2. 观测状态(observation.state)

    • 浮点类型,形状 (8,):包含 8 维状态信息
  3. 动作(action)

    • 浮点类型,形状 (7,):包含 7 维动作指令
  4. 时间戳(timestamp)

    • 浮点类型,形状 (1,)
  5. 帧索引(frame_index)

    • 整数类型,形状 (1,)
  6. 片段索引(episode_index)

    • 整数类型,形状 (1,)
  7. 全局索引(index)

    • 整数类型,形状 (1,)
  8. 任务索引(task_index)

    • 整数类型,形状 (1,)

数据存储路径

  • 数据文件data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
搜集汇总
数据集介绍
main_image_url
构建方式
libero_10_lerobot数据集是基于LeRobot框架,从openVLA社区提供的原始LIBERO数据集中精心构建而成。该数据集聚焦于机器人操作领域,记录了10个不同的操作任务,总计包含379个演示片段和101,469帧时序数据。每个任务在仿真环境中由一台Panda机械臂执行,利用高分辨率摄像头(256×256像素)捕捉双视角视觉信息,并以10 Hz的频率同步记录机械臂的8维状态向量和7维动作向量。数据以Parquet格式存储,视频部分采用高效的AV1编码压缩,整体数据结构遵循LeRobot的v3.0规范,确保了数据的高效存取与跨平台兼容性。
特点
该数据集的核心特点在于其精细化的多模态融合与标准化设计。每一条记录都同时包含来自两个视角的视觉图像、机器人关节状态以及对应的动作指令,为研究视觉-运动策略(visuomotor policy)提供了完整的观测空间。数据集结构规整,包含帧索引、片段索引、时间戳和任务索引等元信息,便于进行序列建模与任务条件化训练。总数据量约300 MB,其中视频数据占比三分之二,适合在中等规模计算资源上进行训练与评估。所有任务均出自LIBERO基准,经过重新格式化为LeRobot标准接口,大幅降低了数据加载和预处理的复杂度。
使用方法
用户可通过HuggingFace的datasets库或LeRobot的专用API直接加载并使用该数据集。推荐使用LeRobot框架中的数据集可视化工具(如HuggingFace Spaces接口)来浏览和验证数据内容。在训练阶段,研究者可以灵活提取图像(observation.images.image和image2)、状态(observation.state)和动作(action)等字段,构建端到端的模仿学习或离线强化学习模型。数据集已预先划分为训练集(全部379个片段),用户可根据自身验证需求进一步拆分。借助LeRobot内置的DataLoader,可直接获得批量化、格式统一的训练数据流,极大简化了机器人学习研究中的数据处理环节。
背景与挑战
背景概述
在机器人学习领域,模仿学习与离线强化学习对高质量、多任务数据集的需求日益迫切。libero_10_lerobot数据集由Hugging Face的LeRobot团队基于原始LIBERO数据集构建,旨在为机器人操作任务提供标准化的基准数据。该数据集于2024年发布,采用Apache-2.0开源许可,共包含10个精细定义的操作任务、379个演示片段及超过10万帧视觉-动作序列,数据来源于Franka Emika Panda机械臂的仿真环境。通过整合多视角图像(分辨率为256×256)、连续状态向量与7维动作空间,该数据集为研究从视觉输入到机器人操控的端到端策略提供了结构化资源。其设计强调任务多样性(如抓取、放置、推拉等)与高帧率(10 FPS)的细粒度记录,显著推动了机器人基础模型与通用操作能力的评估体系发展,成为模仿学习社区中验证算法可迁移性的重要工具。
当前挑战
当前机器人学习面临的核心挑战在于如何从有限、高维的演示数据中泛化到未见场景。libero_10_lerobot数据集虽提供了多任务样本,但每项任务仅约38个演示片段,低数据效率使得策略学习易陷入过拟合,且难以应对物体形状、光照或背景的动态变化。构建过程中,原始LIBERO数据需经历复杂的格式转换、视频压缩(AV1编码)与分块存储(每块1000帧),这要求精准的数据对齐以保持时间一致性;同时,双摄像头视角与状态信息的同步采集在模拟环境中尚可控制,但迁移至真实机器人时,传感器噪声、动力学差异与实时性约束将加剧域迁移挑战。此外,仅有10个任务类别限制了复杂长期规划能力的探索,如何扩展任务规模并保证演示质量与标注一致性,仍是该领域持续求解的关键问题。
常用场景
经典使用场景
LIBERO_10_LeRobot数据集专为机器人操作学习而设计,尤其聚焦于多任务模仿学习与行为克隆范式。其结构化的数据包含高保真视觉观测与低维状态信息,配合连续动作序列,为训练机器人从视觉输入直接映射动作的策略网络提供了理想素材。研究人员常借助该数据集验证算法在有限演示条件下的泛化能力,例如考察模型在未见过物体布局或任务变体上的表现。此外,其标准化的数据格式与LeRobot库的无缝集成,使其成为评估离线强化学习算法基准性能的常用工具。
解决学术问题
该数据集致力于攻克机器人学习中的两个核心学术难题:其一是如何从少量专家演示中高效提取可迁移的操控技能,以缓解数据匮乏困境;其二是解决多任务学习中的任务冲突与知识干扰问题,提升策略在异构场景下的适配性。通过提供10个精心设计的桌面操控任务,它帮助研究者剖析视觉特征解耦与行为先验构建的机理,推动了隐式规划与扩散策略在机器人领域的理论发展。其公开性还加速了可重复研究文化,为后续方法改进提供了对标基线。
衍生相关工作
该数据集的衍生工作主要沿着两条技术路径延伸:一是基于扩散模型的运动生成范式,如一些工作利用其数据探索条件扩散过程在机器人动作序列合成中的鲁棒性;二是视觉-语言模型与机器人策略的交叉融合,研究者将自然语言指令与观测图像对齐,训练出能理解语义并执行复合操作的分层架构。此外,离线到在线微调框架也常以此数据集作为初始化种子,在真实机器人上逐步优化策略。这些衍变共同催生了诸如RT-2等效仿人的具身智能系统的前序实验。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作