libero_90
收藏Hugging Face2026-03-10 更新2026-03-11 收录
下载链接:
https://huggingface.co/datasets/BrunoM42/libero_90
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的,专注于机器人技术领域。数据集包含4500个episodes,总计669043帧,覆盖74个不同的任务。数据以parquet文件格式存储,总数据文件大小为100MB,视频文件大小为500MB。数据集的结构包括视频观察(image和image2,均为128x128像素的RGB视频,10fps)、状态观察(8维浮点数向量)、动作(7维浮点数向量)以及多个索引(如时间戳、帧索引、episode索引等)。所有数据均以10fps的速率采集。数据集仅包含训练集,未提供验证集或测试集。数据集的许可证为Apache-2.0。
创建时间:
2026-03-10
原始信息汇总
数据集概述
基本信息
- 数据集名称: libero_90
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集规模
- 总情节数: 4,500
- 总帧数: 669,043
- 总任务数: 74
- 数据块大小: 1,000
- 数据文件大小: 100 MB
- 视频文件大小: 500 MB
- 帧率: 10 FPS
数据划分
- 训练集: 包含全部 4,500 个情节。
数据结构与特征
数据存储为 Parquet 文件,路径模式为 data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet。
视频存储为 MP4 文件,路径模式为 videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4。
数据集包含以下特征字段:
观测数据
observation.images.image: 视频数据,形状为 [128, 128, 3],帧率 10 FPS,编码格式为 AV1。observation.images.image2: 视频数据,形状为 [128, 128, 3],帧率 10 FPS,编码格式为 AV1。observation.state: 浮点型状态向量,形状为 [8],帧率 10 FPS。
动作与元数据
action: 浮点型动作向量,形状为 [7],帧率 10 FPS。timestamp: 浮点型时间戳,形状为 [1]。frame_index: 整型帧索引,形状为 [1]。episode_index: 整型情节索引,形状为 [1]。index: 整型索引,形状为 [1]。task_index: 整型任务索引,形状为 [1]。
相关链接
- 主页: [信息缺失]
- 论文: [信息缺失]
- 引用 BibTeX: [信息缺失]
搜集汇总
数据集介绍

构建方式
在机器人学习领域,大规模高质量数据集的构建是推动算法进步的关键。libero_90数据集依托LeRobot平台精心构建,通过系统化的数据采集流程,整合了4500个完整交互片段,涵盖74种不同任务场景。数据以每秒10帧的速率记录,采用分块存储策略,每个数据块包含1000个片段,确保了数据组织的高效性与可扩展性。原始观测信息,包括双视角128x128像素的RGB图像和8维状态向量,与7维动作指令及时间戳等元数据同步封装,形成了结构化的序列记录,为模仿学习与强化学习研究提供了坚实的多模态数据基础。
特点
该数据集在机器人操作任务数据集中展现出鲜明的技术特色。其核心在于提供了丰富的多模态观测流,包含两路独立的高帧率视觉通道,能够从不同视角捕捉机械臂与环境的交互细节,有效支持基于视觉的决策模型训练。数据集规模宏大,总计超过66万帧图像,且任务多样性显著,覆盖了广泛的日常操作场景。数据以Parquet格式高效压缩存储,并配有对应的MP4视频文件,便于研究者进行快速加载与可视化分析。统一的元数据架构与清晰的数据划分,进一步提升了其在复杂算法验证与跨任务泛化研究中的实用价值。
使用方法
为充分发挥该数据集在机器人学习研究中的潜力,研究者可通过HuggingFace数据集库直接加载。数据已预分为训练集,可直接用于训练模仿学习或离线强化学习模型。典型的使用流程涉及从Parquet文件中读取图像、状态与动作序列,并利用提供的时间戳和帧索引构建时间对齐的样本。由于数据包含连续的视频流,建议采用滑动窗口等方式构建用于时序预测的训练批次。数据集结构设计兼容常见的深度学习框架,研究者可便捷地提取视觉特征与状态信息,联合训练端到端的策略网络,或进行行为克隆、动态模型学习等任务的基准测试。
背景与挑战
背景概述
在机器人学习领域,高质量、大规模的真实世界交互数据对于推动模仿学习与强化学习算法的进步至关重要。libero_90数据集应运而生,它由HuggingFace的LeRobot项目团队创建,旨在为机器人操作任务提供丰富的多模态演示数据。该数据集收录了4500个交互片段,涵盖74项具体任务,包含视觉观测与机器人状态动作序列,其核心研究问题聚焦于如何利用真实环境下的示教数据提升机器人对复杂任务的泛化与适应能力。通过提供结构化且标注清晰的轨迹信息,libero_90为学术界与工业界在机器人技能学习方面的探索奠定了坚实的数据基础,促进了端到端策略训练与仿真到真实迁移的研究进展。
当前挑战
libero_90数据集致力于应对机器人操作任务中技能泛化与长期规划的核心挑战,其旨在解决从有限示教中学习可迁移策略的难题,尤其在多任务与多场景下的适应性仍面临考验。在构建过程中,数据采集需协调真实机器人平台,确保动作指令的精确同步与传感器数据的一致性,同时处理高维视觉观测的高效压缩与存储。此外,标注大规模交互轨迹并维持任务结构的清晰划分,涉及复杂的工程实现与质量控制,这些因素共同构成了数据集构建的技术壁垒。
常用场景
经典使用场景
在机器人学习领域,libero_90数据集以其丰富的多任务交互数据,为模仿学习与强化学习算法的训练与评估提供了关键支持。该数据集包含4500个交互片段,覆盖74种不同任务,通过双视角视觉观测与机器人状态动作序列,能够模拟真实环境中的复杂操作场景。研究人员常利用这些数据训练端到端策略模型,以提升机器人在非结构化环境中的泛化能力与适应性。
衍生相关工作
围绕libero_90数据集,已衍生出一系列专注于机器人多任务学习与离线强化学习的研究工作。例如,基于其多视角视觉序列,学者们提出了跨模态表征对齐方法,以提升策略的视觉理解能力;同时,该数据集也支持行为克隆与决策变换器类模型的性能评测,推动了离线策略优化与终身学习算法在机器人领域的应用进展。
数据集最近研究
最新研究方向
在机器人学习领域,大规模多任务数据集正成为推动具身智能发展的关键资源。libero_90数据集凭借其丰富的多视角视觉观测与连续动作序列,为模仿学习与离线强化学习算法提供了高质量的实验平台。当前研究热点聚焦于如何利用此类结构化数据训练通用型机器人策略,使其能够泛化至未见过的家庭环境任务。随着开源社区如LeRobot的推动,该数据集促进了跨模态表示学习与任务条件策略网络的创新,为机器人适应复杂动态场景奠定了数据基础。
以上内容由遇见数据集搜集并总结生成



