five

libero_object_image

收藏
Hugging Face2025-07-23 更新2025-07-24 收录
下载链接:
https://huggingface.co/datasets/CathyDYX/libero_object_image
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人学习数据集,包含了454个剧集,共66984帧,10个任务。数据集的结构中包含了多种类型的特征,包括图像、机器人状态、动作和时间戳等。每个剧集都被分割成多个数据块,每个数据块包含1000个样本。数据以Parquet文件格式存储,并且包含了对应的视频文件。
创建时间:
2025-07-14
原始信息汇总

数据集概述

基本信息

  • 名称: libero_object_image
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集描述

  • 创建工具: LeRobot
  • 主页: [More Information Needed]
  • 论文: [More Information Needed]

数据集结构

  • 配置名称: default
  • 数据文件: data//.parquet
  • 元数据文件: meta/info.json

元数据详情

  • 代码库版本: v2.1
  • 机器人类型: panda
  • 总片段数: 454
  • 总帧数: 66984
  • 总任务数: 10
  • 总视频数: 0
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 10 fps
  • 分割:
    • 训练集: 0:454

数据路径

  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

  • observation.images.image:
    • 数据类型: image
    • 形状: [256, 256, 3]
    • 维度名称: ["height", "width", "channel"]
  • observation.images.wrist_image:
    • 数据类型: image
    • 形状: [256, 256, 3]
    • 维度名称: ["height", "width", "channel"]
  • observation.state:
    • 数据类型: float32
    • 形状: [8]
    • 维度名称: ["x", "y", "z", "rx", "ry", "rz", "rw", "gripper"]
  • action:
    • 数据类型: float32
    • 形状: [7]
    • 维度名称: ["x", "y", "z", "roll", "pitch", "yaw", "gripper"]
  • timestamp:
    • 数据类型: float32
    • 形状: [1]
  • frame_index:
    • 数据类型: int64
    • 形状: [1]
  • episode_index:
    • 数据类型: int64
    • 形状: [1]
  • index:
    • 数据类型: int64
    • 形状: [1]
  • task_index:
    • 数据类型: int64
    • 形状: [1]

引用

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,高质量的数据集对于算法训练和系统验证至关重要。libero_object_image数据集基于LeRobot平台构建,采用Franka Emika Panda机械臂进行数据采集,共包含454个完整操作序列和66984帧数据。数据以分块形式存储于Parquet文件中,每块包含1000个连续帧,采样频率为10Hz,确保了时序数据的连贯性和高效存取。数据集通过多模态传感器同步记录机械臂状态、动作指令以及双视角视觉信息(全局图像和腕部摄像头图像),为机器人操作学习提供了丰富的多源异构数据。
特点
该数据集的核心价值在于其精细标注的多模态特性。所有图像数据均以256×256分辨率RGB格式存储,包含全局场景和机械臂末端视角的双重视觉信息。状态空间精确记录了8维机械臂位姿(含四元数旋转表示)及夹爪开合状态,动作空间则采用7维连续向量表征运动控制指令。特别值得注意的是,数据集通过时间戳、帧索引和任务索引实现了跨模态数据的精确对齐,为研究视觉-动作映射、状态估计等关键问题提供了结构化支持。每个数据块还附带完整的元数据描述,便于研究者快速理解数据结构。
使用方法
研究者可通过HuggingFace平台直接访问该数据集,数据以标准Parquet格式组织,兼容主流数据处理框架。典型使用流程包括:通过meta/info.json解析数据结构,按照chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet路径模式加载特定操作序列。图像数据可通过OpenCV或PIL库直接解码,状态和动作向量可直接用于强化学习算法训练。建议采用PyTorch或TensorFlow构建数据管道,利用帧索引实现跨模态数据同步读取。对于时序建模任务,可结合timestamp字段构建连续状态转移样本。
背景与挑战
背景概述
libero_object_image数据集由LeRobot团队基于Apache 2.0协议构建,专注于机器人视觉与操作领域的研究。该数据集采用Franka Emika Panda机械臂作为实验平台,采集了包含454个任务片段、66984帧图像数据,涵盖10种不同操作任务。其核心价值在于提供了多视角RGB观测(包含腕部摄像头)、7自由度机械臂状态信息及动作指令的同步时序数据,为机器人模仿学习与视觉伺服控制研究建立了标准化基准。数据以256×256分辨率的规范化图像格式存储,配合精确的时间戳与帧索引,显著提升了机器人操作任务中视觉-动作关联研究的可复现性。
当前挑战
该数据集面临的核心挑战主要体现在两方面:在领域问题层面,机器人操作任务中复杂场景下的视觉表征学习仍存在困难,包括光照变化、目标遮挡及多物体干扰等现实条件对模型鲁棒性的严峻考验;在构建过程层面,大规模机械臂操作数据的同步采集涉及传感器校准、多模态时序对齐等技术难点,且需确保动作指令与视觉观测间的精确对应。此外,10Hz的采样频率虽能满足基础研究需求,但对高速操作任务的动态捕捉仍存在时间分辨率不足的潜在局限。
常用场景
经典使用场景
在机器人视觉与控制系统研究中,libero_object_image数据集以其丰富的图像和状态数据,成为训练和验证机器人抓取与操作算法的理想选择。该数据集通过高分辨率的图像捕捉和精确的状态记录,为研究者提供了模拟真实环境下机器人操作任务的宝贵资源。
衍生相关工作
围绕libero_object_image数据集,学术界已衍生出多项经典研究工作。其中包括基于深度强化学习的机器人抓取策略优化、多模态感知融合的物体操作算法,以及跨任务迁移学习框架的开发,这些成果显著推动了机器人操作智能化的研究进程。
数据集最近研究
最新研究方向
在机器人视觉与操作领域,libero_object_image数据集凭借其丰富的多模态观测数据,正成为强化学习与模仿学习算法验证的重要基准。该数据集以Franka Panda机械臂为实验平台,记录了454个完整操作序列的高频图像与状态数据,为研究视觉伺服控制、多任务泛化能力提供了关键支持。近期研究热点集中在利用其双视角图像数据(主视角与腕部视角)开发跨模态表征学习框架,以及探索基于Transformer的端到端策略在稀疏奖励环境下的适应性。随着家庭服务机器人需求的增长,该数据集在物体抓取、桌面操作等长周期任务中的价值日益凸显,为解决真实场景下的视觉-动作映射难题提供了标准化评估工具。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作