G1_pickup

Hugging Face2026-02-10 更新2026-02-11 收录

下载链接：

https://huggingface.co/datasets/Harshp1509/G1_pickup

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学数据集，使用LeRobot创建。数据集采用apache-2.0许可证，主要面向机器人技术研究。数据集包含29个episodes，共28941帧数据，涉及1个任务。数据以1000帧为块进行组织，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集记录了Unitree_G1_Inspire机器人的状态观测和动作数据，包括26个关节角度（肩部、肘部、手腕和手指关节）的浮点数值。同时包含左高分辨率摄像头采集的480x640 RGB视频数据（AV1编码，yuv420p格式）。此外，数据集还提供了时间戳、帧索引、episode索引和任务索引等元数据。所有训练数据（episodes 0-29）都用于训练集。数据以parquet文件格式存储，视频以mp4格式存储。该数据集适用于机器人控制、行为模仿学习等研究任务。

创建时间：

2026-02-06

搜集汇总

数据集介绍

构建方式

在机器人操作任务领域，G1_pickup数据集的构建依托于LeRobot框架，通过记录Unitree G1 Inspire机器人的实际执行过程实现。该数据集以30帧每秒的频率采集了29个完整任务片段，共计28941帧数据，并以分块形式存储为Parquet文件，每块包含1000帧。数据采集过程中同步记录了机器人的26维关节状态观测值与对应的26维动作指令，同时配备了左侧高视角摄像头的视频流，确保了状态与动作在时序上的严格对齐，为模仿学习与行为克隆提供了高质量的轨迹样本。

特点

G1_pickup数据集的核心特点在于其多模态与高维度的结构化表示。观测空间不仅包含26个关节的角度状态，还整合了分辨率为640x480的三通道视觉信息，实现了本体感知与外部视觉的融合。动作空间同样设计为26维，与观测状态维度一致，便于直接映射学习。数据集采用分块存储策略，兼顾了大规模数据的高效存取与处理需求，且所有数据均带有精确的时间戳、帧索引与任务索引，支持复杂的时间序列分析与任务特定的模型训练。

使用方法

使用该数据集时，研究者可通过LeRobot库或直接读取Parquet文件加载数据。数据集已预分为训练集，涵盖全部29个任务片段，适用于机器人模仿学习、策略网络训练或视觉-动作联合建模等任务。在模型训练中，可同时利用关节状态观测和对应的图像帧作为输入，以预测或生成相应的关节动作序列。得益于其统一的数据结构与清晰的索引字段，用户可以便捷地进行数据切片、批次加载以及跨模态的特征提取，加速机器人控制算法的开发与验证流程。

背景与挑战

背景概述

G1_pickup数据集是机器人操作领域的一项新兴数据资源，专注于双足仿人机器人的灵巧抓取任务。该数据集由HuggingFace的LeRobot项目团队构建，依托Unitree G1 Inspire机器人平台，采集了包含29个完整交互序列、总计近三万帧的多模态数据。其核心研究问题在于如何通过大规模真实世界交互数据，推动机器人模仿学习与强化学习算法的发展，特别是在复杂非结构化环境中的物体抓取与操控能力。该数据集的发布为机器人学习社区提供了宝贵的实测数据，有助于弥合仿真训练与现实部署之间的鸿沟，对提升机器人自主操作智能具有重要参考价值。

当前挑战

G1_pickup数据集所针对的机器人灵巧操作问题，本身面临高维连续动作空间、多模态感知融合以及长时序决策依赖等固有挑战。在数据集构建过程中，研究者需克服真实机器人数据采集的稳定性与安全性难题，确保长达数万帧的运动轨迹与视觉数据同步精确对齐。同时，数据标注与清洗工作需处理传感器噪声、机械误差以及任务执行中的意外干扰，这些因素均增加了构建高质量、高一致性机器人交互数据集的复杂度。此外，如何有效组织与存储大规模视频与状态动作序列，并设计合理的数据划分以支持泛化性研究，亦是该数据集构建中的关键挑战。

常用场景

经典使用场景

在机器人学习领域，G1_pickup数据集为双臂仿人机器人抓取任务提供了丰富的示范数据。该数据集记录了Unitree G1 Inspire机器人执行物体抓取操作时的关节状态、动作指令以及视觉观测信息，典型应用于模仿学习与强化学习算法的训练与验证。研究人员利用这些时序数据，能够构建从视觉感知到关节控制的端到端策略模型，推动机器人自主操作能力的发展。

解决学术问题

该数据集有效应对了机器人操作中示范数据稀缺的挑战，为研究模仿学习、行为克隆以及离线强化学习提供了标准化基准。通过提供高维状态动作对与同步视觉流，它助力解决从高维观测到连续动作空间的映射问题，促进了策略泛化与样本效率方面的学术探索。其结构化设计支持对多模态感知与运动控制联合建模方法的深入评估，对机器人学习领域的算法创新具有显著意义。

衍生相关工作

围绕该数据集，衍生出了一系列专注于机器人操作学习的经典研究工作。例如，结合视觉语言模型进行任务理解、利用扩散策略生成鲁棒抓取轨迹，以及开发基于Transformer的序列预测模型。这些工作普遍借鉴了数据集中多模态对齐与长时程依赖的特性，推动了从示范数据中学习复合技能的研究方向，并在机器人开源生态中形成了持续的影响力。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集