unitree-g1-dex3-1-pick-kettle-v3

Hugging Face2026-01-26 更新2026-01-27 收录

下载链接：

https://huggingface.co/datasets/Breno-de-Angelo/unitree-g1-dex3-1-pick-kettle-v3

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人技术领域。数据集采用Apache-2.0许可证，包含30个episodes，总计10900帧，涉及1个任务。数据以parquet文件格式存储，分为训练集（0:30）。数据集包含多种特征，如观察状态（28个浮点型关节状态）、动作（28个浮点型关节动作）、左右灰度摄像头图像（400x424x3）、RGB摄像头图像（480x640x3）和深度图（480x640）。所有数据以30fps的帧率采集。数据集总大小为100MB（数据文件）和200MB（视频文件）。适用于机器人控制、行为克隆等任务。

创建时间：

2026-01-23

原始信息汇总

数据集概述

基本信息

数据集名称： unitree-g1-dex3-1-pick-kettle-v3
创建工具： LeRobot
许可证： Apache-2.0
任务类别： 机器人学
标签： LeRobot

数据集规模

总任务数： 1
总情节数： 30
总帧数： 10900
数据块大小： 1000
帧率： 30 FPS
数据文件总大小： 100 MB
视频文件总大小： 200 MB

数据划分

训练集： 包含所有30个情节。

数据结构

数据以Parquet文件格式存储，路径模式为：data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet。视频文件以MP4格式存储，路径模式为：videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4。

数据特征

数据集包含以下关键特征：

观测数据

机器人状态
- 特征名： observation.state
- 数据类型： float32
- 形状： [28]
- 描述： 包含Unitree G1 Dex3机器人28个关节的状态信息，具体关节名称详见元数据。
图像观测
- 左灰度相机（高分辨率）
  - 特征名： observation.images.cam_gray_left_high
  - 数据类型： video
  - 形状： [400, 424, 3]
  - 视频信息： 编码格式AV1，像素格式yuv420p，非深度图，无音频。
- 右灰度相机（高分辨率）
  - 特征名： observation.images.cam_gray_right_high
  - 数据类型： video
  - 形状： [400, 424, 3]
  - 视频信息： 编码格式AV1，像素格式yuv420p，非深度图，无音频。
- RGB相机（高分辨率）
  - 特征名： observation.images.cam_rgb_high
  - 数据类型： video
  - 形状： [480, 640, 3]
  - 视频信息： 编码格式AV1，像素格式yuv420p，非深度图，无音频。
深度观测
- 特征名： observation.depths.depth_high
- 数据类型： float32
- 形状： [480, 640]

动作数据

特征名： action
数据类型： float32
形状： [28]
描述： 机器人28个关节的动作指令，关节名称与observation.state一致。

索引与时间戳

时间戳： timestamp (float32, [1])
帧索引： frame_index (int64, [1])
情节索引： episode_index (int64, [1])
全局索引： index (int64, [1])
任务索引： task_index (int64, [1])

其他信息

代码库版本： v3.0
机器人类型： Unitree_G1_Dex3
主页： 信息缺失
相关论文： 信息缺失
引用格式（BibTeX）： 信息缺失

搜集汇总

数据集介绍

构建方式

在机器人操作学习领域，高质量的数据集对于模型训练至关重要。unitree-g1-dex3-1-pick-kettle-v3数据集依托LeRobot平台构建，专门记录了Unitree G1 Dex3双足机器人执行抓取水壶任务的交互过程。数据采集通过30帧每秒的同步频率，捕获了机器人的28维关节状态观测与对应动作指令，同时整合了多视角视觉信息，包括左右灰度相机、RGB相机及深度传感器数据，形成了共计30条轨迹、10900帧的结构化序列，并以Parquet格式分块存储，确保了数据的高效访问与处理。

特点

该数据集在机器人感知与控制集成方面展现出显著特色。其核心在于提供了高维度的状态与动作对齐表示，关节空间覆盖了肩部、肘部、腕部及手指的精细运动自由度。视觉模态丰富，兼具400x424分辨率的双目灰度图像、480x640的RGB图像以及同分辨率的深度图，实现了多传感器融合的观测体系。数据组织遵循时间序列逻辑，每个数据点均附带时间戳、帧索引与回合索引，支持端到端的模仿学习或强化学习算法开发，且整体规模适中，兼顾了训练效率与任务复杂性。

使用方法

针对机器人技能学习的研究，该数据集可直接用于训练行为克隆或视觉运动策略模型。使用者可通过LeRobot库加载数据，按照分块索引读取Parquet文件，获取观测状态、动作及同步的图像序列。由于数据集已预设训练划分，研究者可基于全部30个回合进行模型训练，利用关节角度与多视角图像作为输入，预测相应的关节控制指令。深度信息可用于增强场景理解，而视频文件则辅助可视化分析。这种结构化设计便于在PyTorch或Jax等框架中构建数据管道，加速机器人抓取任务的算法迭代与验证。

背景与挑战

背景概述

在机器人操作领域，灵巧机械臂执行复杂抓取任务的研究一直是前沿热点。unitree-g1-dex3-1-pick-kettle-v3数据集由LeRobot平台构建，专注于Unitree G1 Dex3双足机器人执行拾取水壶这一特定操作任务。该数据集收录了30个完整交互序列，涵盖10900帧多模态数据，包括高维关节状态、多视角视觉图像及深度信息，旨在为模仿学习与强化学习算法提供高质量的真实世界交互轨迹。其创建顺应了数据驱动机器人控制范式的发展趋势，通过开源共享推动了家庭服务机器人操作技能的泛化能力研究。

当前挑战

该数据集致力于解决机器人灵巧操作中的物体抓取与操控问题，其核心挑战在于高维连续动作空间下的精确轨迹生成与环境感知融合。具体而言，水壶的几何形状与物理特性要求机械手具备柔顺的抓握策略与稳定的力控制，而动态环境中的视觉遮挡与光照变化进一步增加了感知不确定性。在构建过程中，数据采集面临多传感器时间同步、高带宽数据流实时存储以及机器人动作安全边界约束等工程难题，同时确保操作轨迹的多样性与任务成功率之间的平衡亦需精心设计。

常用场景

经典使用场景

在机器人操作学习领域，该数据集为双臂仿人机器人执行精细抓取任务提供了标准化的演示数据。其核心场景聚焦于机器人从复杂环境中自主识别并拾取水壶这一典型操作，通过多模态传感器记录包括关节状态、视觉图像及深度信息在内的完整交互序列。研究者可基于这些时序数据，训练端到端的模仿学习或强化学习模型，使机器人能够复现人类示教的抓取动作，并适应物体姿态与环境的细微变化。

解决学术问题

该数据集有效应对了机器人操作中因缺乏高质量真实世界交互数据而导致的泛化能力不足问题。它通过提供结构化、多模态的演示轨迹，为研究模仿学习中的分布偏移、多传感器融合策略以及跨场景技能迁移等关键课题奠定了数据基础。其意义在于降低了真实机器人实验的成本与门槛，促进了数据驱动方法在复杂操作任务上的可复现性研究，推动了机器人学习从仿真到实物的平稳过渡。

衍生相关工作

围绕该数据集衍生的经典工作主要集中在机器人操作学习的算法创新上。例如，研究者利用其多模态序列开发了基于Transformer的轨迹预测模型，或结合视觉与状态信息构建了分层强化学习框架。这些工作不仅提升了模型在抓取任务上的成功率与鲁棒性，也催生了针对稀疏奖励、长时程规划等挑战的新方法。同时，数据集常被用作基准，用于比较不同模仿学习或离线强化学习算法在真实机器人任务上的性能。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集