pi05-libero-plus

Hugging Face2026-04-28 更新2026-04-29 收录

下载链接：

https://huggingface.co/datasets/reece-omahoney/pi05-libero-plus

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人技术相关的数据集，使用 Apache 2.0 许可证发布。数据集由 LeRobot 创建，包含 1198 个任务和 246149 帧数据。数据以 parquet 格式存储，总数据文件大小为 100MB，视频文件大小为 200MB，帧率为 20fps。数据集包含多个特征字段，如观察图像（分辨率为 256x256x3）、状态（8维浮点数）、动作（7维浮点数）、时间戳、帧索引、集索引、索引、任务索引和成功标志等。这些数据适用于机器人技术的研究和应用，特别是与视觉和动作控制相关的任务。

创建时间：

2026-04-28

原始信息汇总

数据集概述：pi05-libero-plus

该数据集是一个面向机器人学（Robotics）任务的数据集，由 reece-omahoney 提供，并使用 LeRobot 工具创建，遵循 Apache-2.0 许可证。

数据集规模与结构

总片段数（Episodes）：1,198
总帧数（Frames）：246,149
总任务数（Tasks）：1,198
数据文件大小：100 MB
视频文件大小：200 MB
帧率（fps）：20
分片大小：1,000（帧/块）
数据集划分：仅包含训练集，范围为 0:1198（完整数据集）

数据格式与存储路径

数据文件：使用 Parquet 格式，路径为 data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件：使用 MP4 格式，路径为 videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征（Features）详细说明

特征名称	数据类型	形状	说明
`observation.images.image`	video	(256, 256, 3)	主相机图像，分辨率256x256，RGB三通道，AV1编码，帧率10fps
`observation.images.image2`	video	(256, 256, 3)	辅助相机图像，分辨率256x256，RGB三通道，AV1编码，帧率10fps
`observation.state`	float32	(8,)	机器人状态信息，8维向量
`action`	float32	(7,)	机器人动作指令，7维向量
`timestamp`	float32	(1,)	时间戳
`frame_index`	int64	(1,)	帧索引
`episode_index`	int64	(1,)	片段索引
`index`	int64	(1,)	全局索引
`task_index`	int64	(1,)	任务索引
`success`	bool	(1,)	任务是否成功的标志

代码库版本

使用 v3.0 版本的 LeRobot 代码库构建。

搜集汇总

数据集介绍

构建方式

pi05-libero-plus数据集是基于LeRobot框架构建的机器人操作数据集，专为模仿学习和强化学习研究设计。其构建过程涉及在多种任务场景中采集机器人执行操作的演示数据，每个任务对应一个独立的情节，共计包含1198个情节和246149帧数据。数据集通过多模态传感器记录机器人的状态信息，包括两个256x256像素的顶置摄像头图像（以AV1编码的MP4视频格式存储）和8维的机器人关节状态向量。动作数据则以7维浮点向量形式记录，描述了机器人末端执行器的位姿调控指令。所有数据被切分为大小为1000帧的块，存储于Parquet文件和对应视频文件中，并附有详细元数据以描述数据结构与采集参数。

使用方法

使用pi05-libero-plus数据集时，研究人员可借助LeRobot库高效加载数据。首先通过Hugging Face的datasets库配置默认数据集配置，自动读取data/*/*.parquet路径下的Parquet文件，并按需处理多模态特征。图像数据需解码AV1编码的视频帧，而状态和动作数据可直接作为浮点张量使用。由于数据集已预先划分为训练集（0:1198情节），无需自行拆分。典型用法包括训练行为克隆或基于视觉的运动策略，利用观察图像和状态预测7维动作。此外，数据集的视频可视化工具（通过Hugging Face Spaces）可帮助用户直观检验数据质量。建议结合LeRobot的示例脚本，将数据批次化并输入神经网络进行训练与评估。

背景与挑战

背景概述

pi05-libero-plus数据集由研究人员利用LeRobot框架创建，旨在为机器人操作任务提供大规模、多样化的演示数据。该数据集于近期发布，包含1198个独立任务和超过24万帧的高频轨迹数据，覆盖了从状态观测到视觉输入的完整信息，为模仿学习与机器人技能获取研究奠定了坚实基础。其核心研究问题聚焦于如何利用多模态数据（如图像与状态向量）训练机器人适应复杂、长时延的操作任务，在机器人学习领域具有重要影响力，推动了开源数据在仿人机器人与灵巧操作等方向的应用。

当前挑战

该数据集主要解决了机器人领域数据稀缺与任务多样性不足的核心问题。具体挑战包括：1) 细粒度操作任务的泛化，即如何从有限演示中学习高精度、多步骤的复杂动作序列，避免过拟合；2) 多模态数据融合，需同步处理视觉流（256x256 RGB图像）、低维状态向量与动作指令，应对异构数据的时间对齐与噪声干扰；3) 构建过程中，大规模任务（1198个）的人工标注成本高，且需确保演示质量与物理一致性；4) 跨任务迁移学习的困难，即在长尾分布的任务集上验证模型的鲁棒性与零样本适应能力。

常用场景

经典使用场景

在机器人学习与模仿学习的前沿领域，pi05-libero-plus数据集以其丰富的多视角视觉观测与高维状态动作序列，成为训练机器人操作技能的核心资源。该数据集包含1198个独立任务片段，覆盖从简单抓取到复杂装配的多样化场景，每帧记录256×256分辨率的多视角图像、8维机器人状态及7维动作指令。研究者常利用此数据集构建端到端的视觉运动策略，通过行为克隆或离线强化学习范式，使机器人从人类示范中习得灵巧的操作能力，尤其适用于高精度、多步骤的桌面级任务推演。

解决学术问题

该数据集精准回应了机器人学习中长期存在的两大瓶颈：数据规模匮乏与任务泛化困难。其结构化格式支持因果建模与时序对齐，为探索基于Transformer的决策模型或扩散策略等生成式方法提供了标准化基准。通过统一状态空间与动作空间的表述，研究人员能够系统性地评测不同算法在零样本迁移、多任务学习及奖励函数设计上的表现，推动学界从单一任务拟合迈向通用操作智能的范式升级，显著降低了学术研究中数据采集与清洗的重复性劳动。

实际应用

在工业自动化与家庭服务机器人的实际部署中，pi05-libero-plus数据集为技能迁移提供了可复现的训练基石。模型可借由该数据集学习物体抓取、工具操控及物体重新排列等基本操作，进而适应物流分拣、电子元件组装或厨房辅助等场景。其视频与状态动作的高度同步特性，使得仿真环境中的策略能够直接迁移至真实机器人平台，缩短了从实验室原型到产品化落地的调试周期，尤其在需要快速适配新品类的生产线中展现出显著的应用价值。

数据集最近研究