libero_object_image

Hugging Face2025-07-23 更新2025-07-24 收录

下载链接：

https://huggingface.co/datasets/CathyDYX/libero_object_image

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学习数据集，包含了454个剧集，共66984帧，10个任务。数据集的结构中包含了多种类型的特征，包括图像、机器人状态、动作和时间戳等。每个剧集都被分割成多个数据块，每个数据块包含1000个样本。数据以Parquet文件格式存储，并且包含了对应的视频文件。

创建时间：

2025-07-14

原始信息汇总

数据集概述

基本信息

名称: libero_object_image
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集描述

创建工具: LeRobot
主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

配置名称: default
数据文件: data//.parquet
元数据文件: meta/info.json

元数据详情

代码库版本: v2.1
机器人类型: panda
总片段数: 454
总帧数: 66984
总任务数: 10
总视频数: 0
总块数: 1
块大小: 1000
帧率: 10 fps
分割:
- 训练集: 0:454

数据路径

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

observation.images.image:
- 数据类型: image
- 形状: [256, 256, 3]
- 维度名称: ["height", "width", "channel"]
observation.images.wrist_image:
- 数据类型: image
- 形状: [256, 256, 3]
- 维度名称: ["height", "width", "channel"]
observation.state:
- 数据类型: float32
- 形状: [8]
- 维度名称: ["x", "y", "z", "rx", "ry", "rz", "rw", "gripper"]
action:
- 数据类型: float32
- 形状: [7]
- 维度名称: ["x", "y", "z", "roll", "pitch", "yaw", "gripper"]
timestamp:
- 数据类型: float32
- 形状: [1]
frame_index:
- 数据类型: int64
- 形状: [1]
episode_index:
- 数据类型: int64
- 形状: [1]
index:
- 数据类型: int64
- 形状: [1]
task_index:
- 数据类型: int64
- 形状: [1]

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，高质量的数据集对于算法训练和系统验证至关重要。libero_object_image数据集基于LeRobot平台构建，采用Franka Emika Panda机械臂进行数据采集，共包含454个完整操作序列和66984帧数据。数据以分块形式存储于Parquet文件中，每块包含1000个连续帧，采样频率为10Hz，确保了时序数据的连贯性和高效存取。数据集通过多模态传感器同步记录机械臂状态、动作指令以及双视角视觉信息（全局图像和腕部摄像头图像），为机器人操作学习提供了丰富的多源异构数据。

特点

该数据集的核心价值在于其精细标注的多模态特性。所有图像数据均以256×256分辨率RGB格式存储，包含全局场景和机械臂末端视角的双重视觉信息。状态空间精确记录了8维机械臂位姿（含四元数旋转表示）及夹爪开合状态，动作空间则采用7维连续向量表征运动控制指令。特别值得注意的是，数据集通过时间戳、帧索引和任务索引实现了跨模态数据的精确对齐，为研究视觉-动作映射、状态估计等关键问题提供了结构化支持。每个数据块还附带完整的元数据描述，便于研究者快速理解数据结构。

使用方法

研究者可通过HuggingFace平台直接访问该数据集，数据以标准Parquet格式组织，兼容主流数据处理框架。典型使用流程包括：通过meta/info.json解析数据结构，按照chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet路径模式加载特定操作序列。图像数据可通过OpenCV或PIL库直接解码，状态和动作向量可直接用于强化学习算法训练。建议采用PyTorch或TensorFlow构建数据管道，利用帧索引实现跨模态数据同步读取。对于时序建模任务，可结合timestamp字段构建连续状态转移样本。

背景与挑战

背景概述

libero_object_image数据集由LeRobot团队基于Apache 2.0协议构建，专注于机器人视觉与操作领域的研究。该数据集采用Franka Emika Panda机械臂作为实验平台，采集了包含454个任务片段、66984帧图像数据，涵盖10种不同操作任务。其核心价值在于提供了多视角RGB观测（包含腕部摄像头）、7自由度机械臂状态信息及动作指令的同步时序数据，为机器人模仿学习与视觉伺服控制研究建立了标准化基准。数据以256×256分辨率的规范化图像格式存储，配合精确的时间戳与帧索引，显著提升了机器人操作任务中视觉-动作关联研究的可复现性。

当前挑战

该数据集面临的核心挑战主要体现在两方面：在领域问题层面，机器人操作任务中复杂场景下的视觉表征学习仍存在困难，包括光照变化、目标遮挡及多物体干扰等现实条件对模型鲁棒性的严峻考验；在构建过程层面，大规模机械臂操作数据的同步采集涉及传感器校准、多模态时序对齐等技术难点，且需确保动作指令与视觉观测间的精确对应。此外，10Hz的采样频率虽能满足基础研究需求，但对高速操作任务的动态捕捉仍存在时间分辨率不足的潜在局限。

常用场景

经典使用场景

在机器人视觉与控制系统研究中，libero_object_image数据集以其丰富的图像和状态数据，成为训练和验证机器人抓取与操作算法的理想选择。该数据集通过高分辨率的图像捕捉和精确的状态记录，为研究者提供了模拟真实环境下机器人操作任务的宝贵资源。

衍生相关工作

围绕libero_object_image数据集，学术界已衍生出多项经典研究工作。其中包括基于深度强化学习的机器人抓取策略优化、多模态感知融合的物体操作算法，以及跨任务迁移学习框架的开发，这些成果显著推动了机器人操作智能化的研究进程。

数据集最近研究