libero_10_subtasks

Hugging Face2026-01-29 更新2026-01-30 收录

下载链接：

https://huggingface.co/datasets/KeWangRobotics/libero_10_subtasks

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，采用apache-2.0许可证，属于机器人学领域。数据集包含500个episodes，138090帧，10个任务，数据文件大小为100MB，视频文件大小为500MB。数据以parquet格式存储，帧率为10fps。数据集的结构包括状态（8维浮点数数组）、动作（7维浮点数数组）、来自agentview和wrist的RGB图像（3通道128x128像素）、子任务和整体任务（字符串类型）、时间戳、帧索引、episode索引、任务索引等。适用于机器人控制和视觉任务的研究与应用。

This dataset was developed by LeRobot, distributed under the Apache-2.0 license, and falls within the domain of robotics. It comprises 500 episodes, 138090 frames, and covers 10 tasks. The total size of the data files is 100 MB, while the video files amount to 500 MB. The data is stored in Parquet format, with a frame rate of 10 fps. The structure of the dataset includes: state (8-dimensional floating-point array), action (7-dimensional floating-point array), RGB images from agentview and wrist viewpoints (3-channel, 128×128 pixels), subtasks and overall tasks (string type), timestamps, frame indices, episode indices, and task indices. It is applicable to research and applications related to robot control and visual tasks.

创建时间：

2026-01-19

原始信息汇总

数据集概述

基本信息

数据集名称: libero_10_subtasks
发布者: KeWangRobotics
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot
创建工具: 使用 LeRobot 创建。

数据集规模与结构

总任务数: 10
总情节数: 500
总帧数: 138,090
帧率: 10.0 fps
数据块大小: 1000
数据文件大小: 100 MB
视频文件大小: 500 MB
数据格式: Parquet
数据路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: 无
代码库版本: v3.0
机器人类型: libero_panda
数据划分: 所有数据（索引0至500）均用于训练。

数据特征

数据集包含以下特征字段及其数据类型与形状：

状态与动作

state: 浮点32位数组，形状为 [8]，代表8维状态。
actions: 浮点32位数组，形状为 [7]，代表7维动作。

图像观测

images.agentview_rgb: 图像数据，形状为 [3, 256, 256]，代表视角RGB图像。
images.wrist_rgb: 图像数据，形状为 [3, 256, 256]，代表腕部RGB图像。

任务与索引信息

subtask: 字符串，形状为 [1]，代表子任务。
overall_task: 字符串，形状为 [1]，代表整体任务。
task_index: 整型64位，形状为 [1]，代表任务索引。

时间与索引

timestamp: 浮点32位，形状为 [1]，代表时间戳。
frame_index: 整型64位，形状为 [1]，代表帧索引。
episode_index: 整型64位，形状为 [1]，代表情节索引。
index: 整型64位，形状为 [1]，代表索引。

引用信息

主页: 未提供
论文: 未提供
BibTeX 引用: 未提供

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集对于推动算法发展至关重要。libero_10_subtasks数据集依托LeRobot平台构建，通过仿真环境采集了机器人执行10项不同任务时的交互数据。该数据集包含500个完整的情节，总计138,090帧数据，以10帧每秒的速率记录，并以分块Parquet格式存储，便于高效访问与处理。数据采集过程中，机器人状态、动作指令、多视角图像及任务标签均被同步记录，形成了结构化的多模态序列。

特点

该数据集的核心特点在于其丰富的多模态表征与精细的任务标注。数据集中不仅包含8维的机器人状态向量和7维的动作指令，还提供了来自智能体视角和腕部视角的两路256x256 RGB图像流，为视觉-动作联合建模提供了坚实基础。每个数据点均标注了细粒度的子任务标识与整体任务描述，支持分层强化学习与任务分解研究。数据集涵盖10种不同的操作任务，体现了场景的多样性，且所有数据均以统一的时间戳和索引进行组织，确保了时序一致性。

使用方法

为有效利用该数据集进行机器人技能学习研究，研究者可通过加载Parquet文件直接访问结构化数据。数据集已预设训练集划分，涵盖了全部500个情节。典型的应用流程包括从数据中提取状态-动作对与对应的视觉观测，用于训练行为克隆、离线强化学习或世界模型。由于数据包含明确的任务与子任务标签，也适用于涉及课程学习、分层策略或任务泛化的实验。在使用时需注意数据以分块形式存储，可根据索引高效读取特定片段，以适配不同的计算资源与实验需求。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据集对于推动模仿学习与强化学习算法的进步至关重要。libero_10_subtasks数据集作为LeRobot项目的一部分，由HuggingFace社区支持构建，专注于多任务机器人操作场景。该数据集利用Franka Emika Panda机械臂平台，采集了涵盖10项不同子任务的500个完整交互轨迹，总计超过13万帧数据，包含机器人状态、动作指令以及多视角的视觉观测信息。其核心研究问题在于如何通过结构化、细粒度的任务分解，促进机器人对复杂长时程操作任务的理解与泛化能力，为端到端策略学习提供了宝贵的真实世界基准。

当前挑战

该数据集旨在应对机器人操作任务中长时程、多步骤决策的挑战，其核心是解决复杂环境下的子任务序列学习与泛化问题。在构建过程中，面临数据采集一致性与多样性的平衡难题，需确保不同子任务在相同机器人平台上执行的可靠性与可重复性。同时，大规模多模态数据（包括高维状态、动作及双视角图像）的高效存储、同步与标注也构成了显著的技术障碍，要求精密的时序对齐与元数据管理。此外，真实世界物理交互固有的噪声与不确定性，进一步增加了数据质量控制的复杂度。

常用场景

经典使用场景

在机器人学习领域，libero_10_subtasks数据集为模仿学习与强化学习算法的训练与评估提供了关键支持。该数据集通过记录机械臂执行10项复杂子任务的过程，包含状态、动作、视觉图像及任务标签，使得研究人员能够利用这些多模态数据训练模型，以模拟人类操作技能，实现从感知到动作的端到端学习。其结构化的子任务划分尤其适用于研究任务分解与层次化策略，推动机器人自主执行多样化操作。

解决学术问题

该数据集有效应对了机器人学习中样本效率低下与泛化能力不足的挑战。通过提供大规模、高质量的真实机器人交互数据，它支持数据驱动方法的开发，减少对仿真环境的依赖，从而促进模仿学习、离线强化学习等算法的实证研究。其细致的任务标注有助于探索跨任务知识迁移与组合泛化，为解决机器人适应未知场景的学术难题提供了实验基础，加速了智能体在复杂物理环境中的能力提升。

衍生相关工作

围绕libero_10_subtasks数据集，已衍生出多项经典研究工作，主要集中在机器人策略学习与多任务泛化领域。例如，基于其子任务结构，研究者开发了分层强化学习框架，以提升长期任务规划的效能；同时，利用其丰富的视觉数据，推动了视觉-动作表征学习模型的发展，如跨模态预训练方法。这些工作不仅验证了数据集的价值，还拓展了机器人学习在样本复用与自适应控制方面的前沿探索。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集