GATE-VLAP-datasets
收藏GATE-VLAP 数据集概述
数据集基本信息
- 任务类别:强化学习、机器人学
- 标签:机器人学、LIBERO、操作、语义动作分块、视觉语言、模仿学习
- 数据规模:100K < n < 1M
数据集简介
该数据集包含来自 LIBERO 基准套件的预处理数据,专门用于训练具有语义动作分割功能的视觉-语言-动作模型。数据集以原始 PNG + JSON 格式提供,而非预打包的 TAR/WebDataset 文件,旨在提供易于检查、最大灵活性、便于调试、透明且利于版本控制的优势。
包含的数据集
1. LIBERO-10(长视野任务)
- 任务类型:10 个复杂的长视野操作任务
- 分割方法:使用 Gemini Vision API 进行语义动作分块
- 演示数量:跨越 29 个子任务的 1,354 个演示
- 总帧数:103,650 帧
- 子任务:任务被自动分割为原子子任务
- 示例任务:
pick_up_the_black_bowl、close_the_drawer、put_the_bowl_in_the_drawer
2. LIBERO-Object(物体操作任务)
- 任务类型:10 个以物体为中心的操作任务
- 分割方法:基于规则的夹爪检测与停止信号
- 演示数量:跨越 20 个子任务的 875 个演示
- 总帧数:66,334 帧
- 子任务:针对 10 个不同物体的拾取和放置变体
- 示例任务:
pick_up_the_alphabet_soup、place_the_alphabet_soup_on_the_basket
数据集结构
gate-institute/GATE-VLAP-datasets/ ├── libero_10/ # 长视野任务 │ ├── close_the_drawer/ │ │ ├── demo_0/ │ │ │ ├── demo_0_timestep_0000.png # RGB 观测 (128x128) │ │ │ ├── demo_0_timestep_0000.json # 动作与元数据 │ │ │ └── ... │ │ └── ... │ └── ... (共 29 个子任务) ├── libero_object/ # 物体操作任务 │ ├── pick_up_the_alphabet_soup/ │ │ ├── demo_0/ │ │ │ ├── demo_0_timestep_0000.png │ │ │ ├── demo_0_timestep_0000.json │ │ │ └── ... │ │ └── ... │ └── ... (共 20 个子任务) └── metadata/ # 数据集统计与分割信息 ├── libero_10_complete_stats.json ├── libero_10_all_segments.json ├── libero_object_complete_stats.json └── libero_object_all_segments.json
数据格式
JSON 元数据(每时间步)
每个 .json 文件包含:
action:7-DOF 动作(xyz, rpy, gripper)robot_state:关节位置、速度demo_id:演示标识符timestep:时间步subtask:子任务名称parent_task:父任务名称is_stop_signal:片段边界标记
动作空间
- 维度:7-DOF
[0:3]:末端执行器位置增量(x, y, z)[3:6]:末端执行器方向增量(roll, pitch, yaw)[6]:夹爪动作(0.0 = 关闭,1.0 = 打开)
- 范围:归一化至 [-1, 1]
- 控制:增量动作(相对于当前位姿)
图像格式
- 分辨率:128×128 像素
- 通道:RGB(3 通道)
- 格式:PNG(无损压缩)
- 相机:前置智能体视角相机
元数据文件说明
1. libero_10_complete_stats.json
- 用途:整个 LIBERO-10 数据集的概览统计
- 内容:数据集名称、父任务总数、子任务总数、演示总数、总帧数、父任务映射、子任务详情
2. libero_10_all_segments.json
- 用途:每个演示的详细分割元数据
- 内容:演示标识符、子任务、父任务、分割片段列表(含片段ID、起止帧、描述、动作类型)、分割方法、总片段数
3. libero_object_complete_stats.json
- 用途:LIBERO-Object 数据集的统计信息(结构与 LIBERO-10 相同)
- 关键区别:更少、更简单的子任务(20 个 vs 29 个),以物体为中心的任务命名
4. libero_object_all_segments.json
- 用途:LIBERO-Object 演示的分割信息
- 分割方法:基于规则的夹爪检测(通过夹爪状态变化识别片段,停止信号标记任务完成)
引用
如果使用此数据集,请引用:
- Atomic Action Slicing: Planner-Aligned Options for Generalist VLA Agents (arXiv preprint, 2025)
- LIBERO: Benchmarking Knowledge Transfer for Lifelong Robot Learning (NeurIPS 2023)
相关资源
- 模型检查点:https://huggingface.co/gate-institute/GATE-VLAP
- 原始 LIBERO:https://github.com/Lifelong-Robot-Learning/LIBERO
- 论文:https://arxiv.org
致谢
- LIBERO 基准:由 Liu 等人(2023)创建的原始数据集
- 分割:使用 Gemini Vision API 进行 LIBERO-10 语义分块
- 基础设施:在 GATE Institute 基础设施上处理
联系
如有问题,请在 GitHub 仓库提交 Issue。
数据集版本:1.0 最后更新:2025 年 12 月 维护者:GATE Institute




