a2_pick_and_place_1000

Hugging Face2026-02-09 更新2026-02-10 收录

下载链接：

https://huggingface.co/datasets/dgrachev/a2_pick_and_place_1000

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot创建，采用apache-2.0许可证，属于机器人技术类别。数据集包含631个总剧集，195634帧，524个任务，数据文件大小为100MB，视频文件大小为200MB，帧率为30FPS。数据集结构包括元数据文件，详细描述了数据块大小、文件路径、视频路径以及各种特征。特征包括观察状态（14个浮点数，表示末端执行器位置和关节状态）、动作（7个浮点数）、尝试索引、步骤奖励、步骤成功标志、来自四个不同视角的图像观察（前、左、右、夹爪），以及时间戳、帧索引、剧集索引等。数据集适用于机器人技术相关任务，特别是涉及UR5e Robotiq机器人的研究。

创建时间：

2026-01-31

原始信息汇总

数据集概述

基本信息

数据集名称: a2_pick_and_place_1000
创建工具: LeRobot
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

总任务数: 524
总情节数: 631
总帧数: 195634
数据块大小: 1000
帧率: 30 FPS
数据文件大小: 100 MB
视频文件大小: 200 MB
数据分割: 训练集 (0:631)
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

观测状态

特征名: observation.state
数据类型: float32
形状: [14]
字段:
- ee_x
- ee_y
- ee_z
- ee_qx
- ee_qy
- ee_qz
- ee_qw
- joint_0
- joint_1
- joint_2
- joint_3
- joint_4
- joint_5
- gripper

动作

特征名: action
数据类型: float32
形状: [7]
字段:
- x
- y
- z
- qx
- qy
- qz
- qw

尝试索引

特征名: attempt_idx
数据类型: int32
形状: [1]
字段: attempt

步骤奖励

特征名: step_reward
数据类型: float32
形状: [1]
字段: reward

步骤成功标志

特征名: step_success
数据类型: bool
形状: [1]
字段: success

图像观测

前视图像

特征名: observation.images.front
数据类型: video
形状: [3, 480, 640]
字段: channels, height, width
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: h264
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

左视图像

特征名: observation.images.left
数据类型: video
形状: [3, 480, 640]
字段: channels, height, width
视频信息: 同前视图像

右视图像

特征名: observation.images.right
数据类型: video
形状: [3, 480, 640]
字段: channels, height, width
视频信息: 同前视图像

夹爪图像

特征名: observation.images.gripper
数据类型: video
形状: [3, 480, 640]
字段: channels, height, width
视频信息: 同前视图像

索引与时间戳

时间戳: timestamp (float32, 形状 [1])
帧索引: frame_index (int64, 形状 [1])
情节索引: episode_index (int64, 形状 [1])
索引: index (int64, 形状 [1])
任务索引: task_index (int64, 形状 [1])

机器人信息

代码库版本: v3.0
机器人类型: ur5e_robotiq

引用信息

主页: [More Information Needed]
论文: [More Information Needed]
BibTeX引用: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作领域，高质量的数据集对于推动模仿学习与强化学习算法的进步至关重要。a2_pick_and_place_1000数据集依托LeRobot平台构建，通过UR5e机械臂与Robotiq夹爪执行具体的拾取与放置任务，系统采集了631条任务轨迹，共计超过19万帧数据。数据以分块形式组织，每块包含1000帧，并以Parquet格式高效存储，确保了大规模时序数据的管理与读取效率。

特点

该数据集的核心特征在于其多模态与细粒度的标注体系。它不仅提供了机械臂末端执行器的14维状态空间（包括位置、四元数姿态、关节角度及夹爪状态）和7维动作空间，还同步记录了来自前视、左视、右视及夹爪视角的四路RGB视频流，帧率为30fps，分辨率统一为640x480。每一帧数据均附有时序索引、任务索引、尝试次数以及即时的奖励与成功标志，为算法训练提供了丰富的状态-动作对及密集的监督信号。

使用方法

研究人员可利用该数据集进行机器人技能学习的模型训练与评估。数据以标准化的Parquet文件存储，可通过Hugging Face数据集库或兼容框架直接加载。典型的应用流程包括：解析数据块中的观察值（状态与图像）、动作、奖励及成功标签，构建端到端的策略学习或视觉表征学习模型。由于数据集已预设训练划分，用户可直接将其用于训练模仿学习模型，或结合奖励信号开发离线强化学习算法，以学习复杂的拾放操作策略。

背景与挑战

背景概述

在机器人操作领域，模仿学习与强化学习的发展亟需大规模、高质量的真实世界交互数据作为支撑。a2_pick_and_place_1000数据集应运而生，由HuggingFace的LeRobot项目团队创建，旨在为机器人抓取与放置任务提供丰富的多模态演示数据。该数据集聚焦于核心研究问题，即如何利用从真实UR5e机械臂收集的观测与动作序列，训练出能够泛化至多样化场景的灵巧操作策略。其包含超过19万帧图像与状态数据，覆盖524项独立任务，通过整合多视角视觉输入与精确的末端执行器状态，为推进机器人自主操作能力奠定了坚实的数据基础，对机器人学习社区产生了显著的推动作用。

当前挑战

该数据集致力于解决机器人操作中模仿学习与策略泛化的核心挑战，即如何从有限的演示中学习能够适应物体属性、初始位置及环境动态变化的稳健策略。其构建过程面临多重困难：真实机器人数据采集成本高昂且耗时，需确保硬件系统的可靠性与安全性；多传感器数据（如四路摄像头视频与关节状态）的精确时间同步与标定极具技术复杂度；此外，标注大规模连续动作空间中的成功标签并保证演示质量的一致性，亦是数据收集中的关键难题。这些挑战共同凸显了构建高质量机器人交互数据集的固有复杂性。

常用场景

经典使用场景

在机器人操作领域，a2_pick_and_place_1000数据集为模仿学习与强化学习算法提供了丰富的训练资源。该数据集通过UR5e机械臂与Robotiq夹爪执行抓取放置任务，记录了多视角视觉观测、关节状态及动作序列，使得研究者能够基于真实机器人交互数据训练端到端策略。其经典使用场景在于模拟工业自动化中的物料搬运流程，为算法在复杂环境下的泛化能力评估奠定基础。

解决学术问题

该数据集有效应对了机器人学习研究中数据稀缺与仿真-现实差距的挑战。通过提供大规模真实世界交互记录，它支持了从视觉输入到连续动作映射的模型训练，促进了基于数据的策略优化方法发展。其意义在于降低了机器人实验的硬件门槛，加速了模仿学习、离线强化学习等领域的实证研究，为跨任务迁移与多模态感知融合提供了基准。

衍生相关工作

围绕该数据集，已衍生出多项经典研究工作，包括基于Transformer的序列建模方法、视觉-动作联合表征学习框架以及跨模态预训练技术。这些工作利用数据集的多视角视频与状态信息，探索了机器人策略的泛化性与鲁棒性，进一步推动了端到端操作模型的创新，并为开源机器人社区贡献了可复现的算法基准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集