oorbt/libero_object_lerobot
收藏Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/oorbt/libero_object_lerobot
下载链接
链接失效反馈官方服务:
资源简介:
该数据集使用LeRobot创建,基于openVLA的原始LIBERO数据集。它包含454个episodes,66984帧,10个任务,数据文件大小为100MB,视频文件大小为200MB,帧率为10fps。数据集结构包括观察图像、状态、动作、时间戳、帧索引、episode索引、索引和任务索引等特征。
This dataset was created using LeRobot, based on the raw LIBERO dataset from openVLA. It includes 454 episodes, 66984 frames, 10 tasks, with data files size of 100MB and video files size of 200MB, at 10fps. The dataset structure features observation images, state, action, timestamp, frame index, episode index, index, and task index.
提供机构:
oorbt
搜集汇总
数据集介绍

构建方式
在机器人学习领域,高质量的数据集是驱动算法进步的关键。libero_object_lerobot数据集源于经典的LIBERO基准,经由LeRobot框架精心重构而成。其构建过程依托于Hugging Face平台上的openVLA仓库所发布的原始LIBERO数据,通过标准化的管道将原始数据转化为统一的parquet格式,并辅以高效的AV1压缩视频存储。数据集共包含454个完整轨迹,采样频率为10帧/秒,涵盖10种不同的操作任务,总帧数达66,984帧,为机器人模仿学习与策略泛化研究提供了坚实的数据基础。
特点
该数据集最显著的特点在于其结构化的设计与多模态信息的融合。每条轨迹均记录了两个256×256像素的视觉观测图像、8维的机器人状态向量以及7维的动作指令,数据格式清晰且一致。通过将任务索引、时间戳与帧序号等元数据纳入特征体系,研究者能够便捷地对数据进行切片、筛选与时序对齐。此外,数据集蕴含了丰富的任务变体与场景多样性,使其在评估策略跨任务迁移能力与泛化性能方面独具优势。
使用方法
使用libero_object_lerobot数据集时,可借助LeRobot库提供的标准API进行加载与处理。研究者通过配置数据路径与特征规格,能够高效地将parquet格式的轨迹数据与视频流送入训练流水线。数据集支持按episode索引迭代访问,并预设了训练集划分(0至453号轨迹),便于直接用于模仿学习或离线强化学习实验。结合可视化界面,用户还可直观浏览每个轨迹的视觉观测与动作序列,从而快速理解数据分布与任务特性。
背景与挑战
背景概述
在机器人学习领域,高质量、标准化的数据集对于推动技能学习与泛化研究至关重要。libero_object_lerobot数据集由LeRobot团队基于openVLA改造的原始LIBERO数据集创建,于近年发布,采用Apache-2.0许可证,旨在为机器人操作任务提供结构化、可复现的训练数据。该数据集聚焦于桌面物体操作场景,涵盖10种任务及454个轨迹片段,总计约67000帧,通过Franka Emika Panda机械臂采集,包含256x256分辨率的双视角视觉图像与8维状态信息。其核心研究问题在于促进模仿学习与视觉运动策略的基准测试,已在Robot Learning社区中作为标准化评估平台产生广泛影响,尤其为多任务泛化与数据高效学习研究提供了关键支撑。
当前挑战
在领域问题层面,libero_object_lerobot致力于应对机器人操作中多任务学习与零样本泛化的核心挑战。传统方法难以在有限样本下实现跨任务技能迁移,而该数据集通过提供统一格式的多任务演示,为学习鲁棒的视觉运动策略奠定基础。在构建过程中,团队面临多项技术难题:原始LIBERO数据集需转换为LeRobot标准格式,包括重新编码视频为AV1压缩格式以平衡存储与质量,将动作空间从原始配置标准化为7维连续向量,并确保双视角图像的时间同步与分辨率一致性。此外,数据分割策略需兼顾训练有效性,最终仅设置训练集(不含验证/测试划分),这对模型泛化评估方式提出了额外设计需求。
常用场景
经典使用场景
在机器人学习与仿真控制领域,libero_object_lerobot数据集作为一项精心构建的基准资源,广泛应用于模仿学习与行为克隆算法的训练与评估。该数据集涵盖了454个完整示范片断,并整合了10种不同的操作任务,每项任务均以高精度机械臂Panda在仿真环境中完成。通过记录包括第一视角与补充视角的双路视觉图像(256×256分辨率)以及8维状态向量与7维动作序列,该数据集为研究从感知到控制的端到端映射提供了标准化的训练素材,尤其适合用于验证模型在长序列任务中的泛化与稳健能力。
实际应用
在实际应用中,libero_object_lerobot数据集为机器人操作技能的自动化部署提供了坚实的模拟支撑。基于该数据集训练的模仿学习模型可以迁移至真实机器人平台,执行诸如物体抓取、重新排列和精准放置等日常操作任务。例如,在智能仓储和家庭服务场景中,机器人能够依据视觉输入对环境状态进行实时感知,并决策出连贯的动作指令以完成特定目标。该数据集所强调的低延迟控制与多视角视觉融合,为工业机械臂的灵活性与自主性的提升奠定了数据基础,助力智能系统从实验室环境走向真实世界。
衍生相关工作
基于libero_object_lerobot数据集的发布,学术界涌现出一系列极具影响力的创新工作。其中最引人瞩目的当属利用该数据集训练的大规模视觉-语言-动作模型,其核心思想是将任务描述作为语言指令输入,驱动机械臂在复杂环境中实现零样本或无样本泛化。此外,该数据集还催生了多任务策略蒸馏、层级任务分解以及基于扩散策略的动作生成等前沿方向。众多研究者借助这些示范数据,系统探究了动作序列的判别式与生成式建模差异,并由此引申出更具鲁棒性的策略优化框架,使机器人学习在可解释性与自适应能力上稳步迭代。
以上内容由遇见数据集搜集并总结生成



