globcy/libero_subtask_lerobot_v2_subset
收藏Hugging Face2026-04-10 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/globcy/libero_subtask_lerobot_v2_subset
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- robotics
tags:
- LeRobot
- libero
- panda
- rlds
configs:
- config_name: default
data_files: data/*/*.parquet
---
This dataset was created using [LeRobot](https://github.com/huggingface/lerobot).
<a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=globcy/libero_subtask_lerobot_v2_subset">
<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/>
<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/>
</a>
## Dataset Description
- **Homepage:** [More Information Needed]
- **Paper:** [More Information Needed]
- **License:** apache-2.0
## Dataset Structure
[meta/info.json](meta/info.json):
```json
{
"codebase_version": "v3.0",
"robot_type": "panda",
"total_episodes": 281,
"total_frames": 47682,
"total_tasks": 8,
"chunks_size": 1000,
"data_files_size_in_mb": 100,
"video_files_size_in_mb": 200,
"fps": 10,
"splits": {
"train": "0:281"
},
"data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet",
"video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4",
"features": {
"observation.images.image": {
"dtype": "image",
"shape": [
224,
224,
3
],
"names": [
"height",
"width",
"channel"
]
},
"observation.images.image2": {
"dtype": "image",
"shape": [
224,
224,
3
],
"names": [
"height",
"width",
"channel"
]
},
"observation.state": {
"dtype": "float32",
"shape": [
8
],
"names": [
"state"
]
},
"action": {
"dtype": "float32",
"shape": [
7
],
"names": [
"actions"
]
},
"subtask_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"timestamp": {
"dtype": "float32",
"shape": [
1
],
"names": null
},
"frame_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"episode_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"task_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
}
}
}
```
## Citation
**BibTeX:**
```bibtex
[More Information Needed]
```
提供机构:
globcy
搜集汇总
数据集介绍

构建方式
该数据集源自LeRobot框架,专注于机器人操作任务的模仿学习研究。构建过程中,使用Panda机械臂在仿真环境中完成8种不同的子任务,共计281个轨迹片段,涵盖47682帧时间序列数据。每个轨迹均以10帧每秒的采样率记录,并划分为训练集(全部281个轨迹)。数据以Parquet格式存储观察图像(224×224像素的双摄像头视角)、机器人8维状态向量及7维动作指令,同时附加子任务索引、时间戳等元信息,形成结构化的经验池。
特点
数据集的核心特色在于其精细的子任务标注与多模态感知融合。每个轨迹均包含明确的子任务索引,便于细粒度行为分析与层次化策略学习。双摄像头视觉输入提供了丰富的场景上下文,而低维状态与动作空间保持了对真实机器人控制的兼容性。281个轨迹虽规模适中,但覆盖8类典型操作任务,配合完整的视频记录(MP4格式),为行为克隆与离线强化学习提供了高质量的标准基准。
使用方法
使用者可通过LeRobot库直接加载数据集,其兼容HuggingFace Datasets接口,支持按轨迹或帧随机访问。训练时,可提取'observation.images'双视角图像经CNN编码,与'observation.state'拼接后输入策略网络,以回归方式预测7维连续动作。由于已预设训练集划分(索引0至280),建议采用批处理方式迭代,结合数据增强(如随机裁剪)提升泛化性。验证时可通过可视化工具观察机械臂执行结果与子任务对齐情况。
背景与挑战
背景概述
在机器人学习领域,复杂任务的长时序操作与子任务分解一直是研究难点。libero_subtask_lerobot_v2_subset 数据集由 Hugging Face 的 LeRobot 社区于近期创建,依托 Franka Emika Panda 机械臂平台,旨在为基于视觉的机器人子任务学习提供标准化基准。该数据集包含 281 个完整演示片段、47682 帧图像及 8 种不同任务,通过双视角 224×224 RGB 图像、8 维状态向量与 7 维动作空间,精确记录机器人在桌面操作中的子任务级行为。数据集以 Apache-2.0 协议开源,并集成于 LeRobot 生态,支持即插即用的可视化和模型训练,显著降低了机器人学习研究的入门门槛。其子任务标注机制为细粒度技能学习、任务规划及模仿学习提供了关键数据支撑,推动了具身智能研究中动作分解与泛化能力的发展。
当前挑战
该数据集所解决的领域挑战在于:机器人操作任务通常具有高度连续性和多模态特性,传统端到端方法难以捕捉子任务间的时序依赖与语义边界,而该数据集通过子任务索引显式标注了任务片段,助力模型学习层次化决策结构。在构建过程中,面临的核心挑战包括:1)机械臂演示采集的精确性——需确保 10 FPS 帧率下双视角图像与状态、动作的同步,避免因传感器延迟导致子任务对齐错误;2)数据规模与多样性的平衡——281 个片段、8 种任务虽提供了可控实验环境,但较少的样本量对从有限演示中泛化跨场景技能提出了更高要求;3)子任务标注的一致性——手动或自动划分子任务边界时,需避免歧义,以保证后续算法评测的可靠性。
常用场景
经典使用场景
在机器人学习领域,libero_subtask_lerobot_v2_subset数据集为基于视觉的运动策略训练提供了坚实的数据基础。该数据集采集自Panda机械臂,包含281个演示片段、共计47682帧图像与状态信息,覆盖8个不同子任务场景。研究者常利用此数据集进行模仿学习中的动作预测建模,通过将双视角RGB图像(224×224像素)与8维机器人状态向量作为输入,训练模型输出7维关节动作指令。其标准化的parquet格式与LeRobot框架的无缝集成,使得数据加载与预处理流程高度统一,为多任务学习、行为克隆及离线强化学习等经典范式提供了可复现的基准测试平台。
实际应用
在实际工业与科研场景中,libero_subtask_lerobot_v2_subset直接服务于可重复编程的柔性装配任务。基于该数据集训练的视觉运动策略,可引导Panda机械臂在桌面环境下执行如“抓取并放置”、“开抽屉”等精细操作,无需人工逐帧编程。其采用了Apache-2.0开源协议,降低了企业研发门槛,加速了从实验室仿真到真实产线部署的转化进程。此外,数据集内嵌的LeRobot可视化工具链,使得工程师能够直观检查演示质量与策略执行效果,为机器人操作系统的快速原型验证提供了高效支撑。
衍生相关工作
该数据集的问世催生了一系列具有影响力的衍生研究工作。在算法层面,基于其子任务分割特性,研究者发展了分层模仿学习架构,将整体操作分解为可独立训练的原子技能模块。同时,利用其多视角图像信息,推动了视觉预训练模型(如R3M、RT-1)在具体机械臂操作中的微调技术演进。部分工作还借鉴其数据格式标准化经验,构建了跨机器人平台的通用操作数据集(如Open X-Embodiment),进一步放大了该数据集在机器人社区中的基准价值。这些衍生工作共同构成了从数据收集到策略部署的完整闭环生态。
以上内容由遇见数据集搜集并总结生成



