five

libero_32tasks_train_v3

收藏
Hugging Face2026-02-14 更新2026-02-15 收录
下载链接:
https://huggingface.co/datasets/siamaky1984/libero_32tasks_train_v3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于机器人技术研究的开源数据集,基于LeRobot平台创建。数据集采用Apache-2.0许可协议,主要面向机器人控制和学习任务。数据集包含多种模态数据:256x256 RGB图像(包括主视角和腕部视角图像)、8维状态向量、7维动作向量,以及时间戳、帧索引、任务索引等多种元数据。数据集规模为217,214个训练样本,总大小约27.7GB。原始数据来自1039个不同的操作片段,覆盖24个不同任务,采集帧率为10fps。该数据集特别适用于机器人视觉-动作联合学习、模仿学习等研究场景。数据以分块Parquet格式存储,并包含相应的视频文件。

This is an open-source dataset for robotics research, developed based on the LeRobot platform. It is licensed under Apache-2.0, and is primarily intended for robotics control and learning tasks. The dataset includes multi-modal data: 256×256 RGB images (covering first-person and wrist-mounted viewpoint images), 8-dimensional state vectors, 7-dimensional action vectors, as well as various metadata such as timestamps, frame indices, and task indices. The dataset consists of 217,214 training samples, with a total size of approximately 27.7 GB. The raw data is sourced from 1,039 distinct manipulation segments across 24 different tasks, and was collected at a frame rate of 10 fps. This dataset is particularly applicable to research scenarios such as robotic vision-action joint learning and imitation learning. The data is stored in chunked Parquet format, with corresponding video files included.
创建时间:
2026-02-13
原始信息汇总

数据集概述

基本信息

  • 数据集名称: siamaky1984/libero_32tasks_train_v3
  • 许可协议: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot, libero, panda, baseline, stratified-split
  • 创建工具: 使用 LeRobot 创建。

数据集结构

  • 配置名称: default
  • 数据文件:
    • 训练集路径: data/train-*
  • 特征:
    • image: 图像,形状为 [256, 256, 3]。
    • wrist_image: 图像,形状为 [256, 256, 3]。
    • state: 浮点数列表,长度为 8。
    • actions: 浮点数列表,长度为 7。
    • timestamp: 浮点数。
    • frame_index: 整数。
    • episode_index: 整数。
    • index: 整数。
    • task_index: 整数。
  • 数据划分:
    • 训练集:
      • 样本数量: 217,214
      • 字节数: 27,742,306,070
  • 数据集大小: 27,742,306,070 字节
  • 下载大小: 27,897,989,746 字节

元数据详情

  • 代码库版本: v3.0
  • 机器人类型: panda
  • 总情节数: 1,039
  • 总帧数: 137,360
  • 总任务数: 24
  • 块大小: 1,000
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB
  • 帧率: 10 FPS
  • 划分: 训练集包含所有情节 (0:1039)。
  • 数据路径格式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频路径格式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

引用信息

  • 主页: 未提供
  • 论文: 未提供
  • BibTeX 引用: 未提供
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集对于推动算法发展至关重要。libero_32tasks_train_v3数据集依托LeRobot框架构建,通过Franka Panda机器人平台采集多模态交互数据。数据采集过程以分层分割策略组织,涵盖24项独立任务,总计1039条完整轨迹,形成超过13.7万帧的序列记录。每帧数据均包含256x256分辨率的场景图像与腕部视角图像,辅以8维状态向量与7维动作向量,并以10Hz频率同步时间戳与索引信息,最终以分块Parquet格式存储,确保数据结构的规范性与访问效率。
使用方法
研究者可通过HuggingFace平台直接加载该数据集,利用其预定义的数据分割接口快速访问训练集。典型使用流程包括调用标准数据加载器读取图像、状态与动作序列,并依据时间戳重建完整任务轨迹。数据集中每个样本均附带帧索引、回合编号与任务标识,便于进行跨任务分析或分层抽样。在算法开发中,可结合双视角图像进行多模态特征融合,利用状态动作对训练动力学模型或行为克隆策略。数据集兼容主流机器学习框架,其分块存储设计亦支持流式读取与分布式处理,适用于大规模离线强化学习或世界模型构建等前沿研究方向。
背景与挑战
背景概述
在机器人学习领域,构建能够适应多样化任务且具备泛化能力的智能体是核心研究目标之一。libero_32tasks_train_v3数据集由HuggingFace的LeRobot项目团队创建,旨在为机器人操作任务提供大规模、多模态的示范数据。该数据集基于Franka Emika Panda机器人平台,采集了涵盖24项不同任务的演示轨迹,包含超过10万帧的图像、状态与动作序列,为模仿学习与强化学习算法的训练与评估奠定了数据基础。其设计体现了当前机器人社区对于可扩展、标准化数据集的迫切需求,以推动从单一任务到多任务泛化的研究进展。
当前挑战
该数据集致力于解决机器人操作中的多任务学习与泛化问题,其核心挑战在于如何从有限的人类演示中学习能够跨越不同场景与目标的策略。具体而言,数据中任务间的语义差异与动态变化要求模型具备强大的表征学习与上下文推理能力。在构建过程中,挑战主要集中于数据采集的规模与质量平衡,例如确保多视角图像同步、状态动作对齐的精确性,以及在不同任务间保持数据分布的一致性与完整性,这些因素直接影响后续学习算法的性能与可靠性。
常用场景
经典使用场景
在机器人学习领域,视觉-动作映射的端到端模型训练是核心挑战之一。libero_32tasks_train_v3数据集通过提供多视角图像、机器人状态与动作序列的同步记录,为模仿学习与强化学习算法提供了丰富的训练素材。该数据集尤其适用于训练基于视觉的机器人策略模型,使机器人能够从人类演示中学习复杂操作任务,如物体抓取、放置与组装等。
解决学术问题
该数据集有效应对了机器人学习中样本效率低下与泛化能力不足的难题。通过涵盖32种不同的任务场景,它促进了跨任务知识迁移的研究,助力解决长期动作序列规划、多模态感知融合以及稀疏奖励环境下的策略优化等关键学术问题。其结构化数据为验证新型算法在真实机器人平台上的性能提供了基准。
实际应用
在实际机器人部署中,libero_32tasks_train_v3数据集支持开发适应多样化环境的自主操作系统。例如,在工业自动化中,基于该数据训练的模型可应用于柔性装配线,实现零样本或少样本的任务适应;在家庭服务机器人领域,则能提升机器人处理日常物品整理与交互的鲁棒性,推动机器人从受限实验室环境向开放场景的过渡。
数据集最近研究
最新研究方向
在机器人学习领域,多任务操作技能的泛化能力正成为前沿探索的核心议题。libero_32tasks_train_v3数据集以其涵盖24项复杂操作任务的丰富轨迹数据,为研究视觉-动作映射的跨任务迁移提供了关键支撑。当前研究热点聚焦于利用此类大规模多模态数据,开发能够从有限演示中快速适应新场景的元强化学习框架,以及探索基于Transformer的序列模型在长时程任务规划中的应用。这些进展不仅推动了家庭服务机器人自主操作能力的边界,也为具身智能系统在非结构化环境中的稳健部署奠定了数据基础,具有深远的学术与工程意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作