globcy/libero_subtask_lerobot_v2_subset

Name: globcy/libero_subtask_lerobot_v2_subset
Creator: globcy
Published: 2026-04-10 15:39:55
License: 暂无描述

Hugging Face2026-04-10 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/globcy/libero_subtask_lerobot_v2_subset

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - robotics tags: - LeRobot - libero - panda - rlds configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). <a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=globcy/libero_subtask_lerobot_v2_subset"> <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/> <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/> </a> ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "panda", "total_episodes": 281, "total_frames": 47682, "total_tasks": 8, "chunks_size": 1000, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200, "fps": 10, "splits": { "train": "0:281" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "features": { "observation.images.image": { "dtype": "image", "shape": [ 224, 224, 3 ], "names": [ "height", "width", "channel" ] }, "observation.images.image2": { "dtype": "image", "shape": [ 224, 224, 3 ], "names": [ "height", "width", "channel" ] }, "observation.state": { "dtype": "float32", "shape": [ 8 ], "names": [ "state" ] }, "action": { "dtype": "float32", "shape": [ 7 ], "names": [ "actions" ] }, "subtask_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null } } } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```

提供机构：

globcy

搜集汇总

数据集介绍

构建方式

该数据集源自LeRobot框架，专注于机器人操作任务的模仿学习研究。构建过程中，使用Panda机械臂在仿真环境中完成8种不同的子任务，共计281个轨迹片段，涵盖47682帧时间序列数据。每个轨迹均以10帧每秒的采样率记录，并划分为训练集（全部281个轨迹）。数据以Parquet格式存储观察图像（224×224像素的双摄像头视角）、机器人8维状态向量及7维动作指令，同时附加子任务索引、时间戳等元信息，形成结构化的经验池。

特点

数据集的核心特色在于其精细的子任务标注与多模态感知融合。每个轨迹均包含明确的子任务索引，便于细粒度行为分析与层次化策略学习。双摄像头视觉输入提供了丰富的场景上下文，而低维状态与动作空间保持了对真实机器人控制的兼容性。281个轨迹虽规模适中，但覆盖8类典型操作任务，配合完整的视频记录（MP4格式），为行为克隆与离线强化学习提供了高质量的标准基准。

使用方法

使用者可通过LeRobot库直接加载数据集，其兼容HuggingFace Datasets接口，支持按轨迹或帧随机访问。训练时，可提取'observation.images'双视角图像经CNN编码，与'observation.state'拼接后输入策略网络，以回归方式预测7维连续动作。由于已预设训练集划分（索引0至280），建议采用批处理方式迭代，结合数据增强（如随机裁剪）提升泛化性。验证时可通过可视化工具观察机械臂执行结果与子任务对齐情况。

背景与挑战

背景概述

在机器人学习领域，复杂任务的长时序操作与子任务分解一直是研究难点。libero_subtask_lerobot_v2_subset 数据集由 Hugging Face 的 LeRobot 社区于近期创建，依托 Franka Emika Panda 机械臂平台，旨在为基于视觉的机器人子任务学习提供标准化基准。该数据集包含 281 个完整演示片段、47682 帧图像及 8 种不同任务，通过双视角 224×224 RGB 图像、8 维状态向量与 7 维动作空间，精确记录机器人在桌面操作中的子任务级行为。数据集以 Apache-2.0 协议开源，并集成于 LeRobot 生态，支持即插即用的可视化和模型训练，显著降低了机器人学习研究的入门门槛。其子任务标注机制为细粒度技能学习、任务规划及模仿学习提供了关键数据支撑，推动了具身智能研究中动作分解与泛化能力的发展。

当前挑战

该数据集所解决的领域挑战在于：机器人操作任务通常具有高度连续性和多模态特性，传统端到端方法难以捕捉子任务间的时序依赖与语义边界，而该数据集通过子任务索引显式标注了任务片段，助力模型学习层次化决策结构。在构建过程中，面临的核心挑战包括：1）机械臂演示采集的精确性——需确保 10 FPS 帧率下双视角图像与状态、动作的同步，避免因传感器延迟导致子任务对齐错误；2）数据规模与多样性的平衡——281 个片段、8 种任务虽提供了可控实验环境，但较少的样本量对从有限演示中泛化跨场景技能提出了更高要求；3）子任务标注的一致性——手动或自动划分子任务边界时，需避免歧义，以保证后续算法评测的可靠性。

常用场景

经典使用场景

在机器人学习领域，libero_subtask_lerobot_v2_subset数据集为基于视觉的运动策略训练提供了坚实的数据基础。该数据集采集自Panda机械臂，包含281个演示片段、共计47682帧图像与状态信息，覆盖8个不同子任务场景。研究者常利用此数据集进行模仿学习中的动作预测建模，通过将双视角RGB图像（224×224像素）与8维机器人状态向量作为输入，训练模型输出7维关节动作指令。其标准化的parquet格式与LeRobot框架的无缝集成，使得数据加载与预处理流程高度统一，为多任务学习、行为克隆及离线强化学习等经典范式提供了可复现的基准测试平台。

实际应用

在实际工业与科研场景中，libero_subtask_lerobot_v2_subset直接服务于可重复编程的柔性装配任务。基于该数据集训练的视觉运动策略，可引导Panda机械臂在桌面环境下执行如“抓取并放置”、“开抽屉”等精细操作，无需人工逐帧编程。其采用了Apache-2.0开源协议，降低了企业研发门槛，加速了从实验室仿真到真实产线部署的转化进程。此外，数据集内嵌的LeRobot可视化工具链，使得工程师能够直观检查演示质量与策略执行效果，为机器人操作系统的快速原型验证提供了高效支撑。

衍生相关工作

该数据集的问世催生了一系列具有影响力的衍生研究工作。在算法层面，基于其子任务分割特性，研究者发展了分层模仿学习架构，将整体操作分解为可独立训练的原子技能模块。同时，利用其多视角图像信息，推动了视觉预训练模型（如R3M、RT-1）在具体机械臂操作中的微调技术演进。部分工作还借鉴其数据格式标准化经验，构建了跨机器人平台的通用操作数据集（如Open X-Embodiment），进一步放大了该数据集在机器人社区中的基准价值。这些衍生工作共同构成了从数据收集到策略部署的完整闭环生态。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集