pick-place-UR5e-eef-eef

Hugging Face2026-02-08 更新2026-02-09 收录

下载链接：

https://huggingface.co/datasets/ravtscheev/pick-place-UR5e-eef-eef

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，专为机器人学和操作任务设计。数据集采用apache-2.0许可证，包含1000个episodes，总计674480帧数据，数据文件大小为100MB，视频文件大小为200MB，帧率为20fps。数据集结构包括来自两个摄像头（camera_base和camera_wrist_right）的视频观察数据，机器人状态观察数据（包括末端执行器位姿和夹爪宽度），以及动作数据（包括末端执行器动作和夹爪动作）。此外，还包含时间戳、帧索引、episode索引、任务索引等信息。数据集适用于机器人操作、状态估计和动作预测等任务。

This dataset was created by LeRobot and is specifically designed for robotics and manipulation tasks. It is released under the Apache-2.0 license. It contains 1000 episodes, totaling 674,480 frames, with a data file size of 100 MB, a video file size of 200 MB, and a frame rate of 20 fps. The dataset structure includes video observations from two cameras (camera_base and camera_wrist_right), robot state observations (including end-effector pose and gripper width), as well as action data (including end-effector actions and gripper actions). Additionally, it includes timestamps, frame indices, episode indices, task indices and other relevant information. This dataset is suitable for tasks such as robot manipulation, state estimation and action prediction.

创建时间：

2026-02-08

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于真实物理系统的交互记录。pick-place-UR5e-eef-eef数据集通过UR5e机械臂平台，采集了1000个完整的操作片段，总计包含674480帧数据。该数据集采用LeRobot框架进行系统性录制，以20帧每秒的频率同步捕获来自基座相机和腕部相机的视觉信息，同时记录末端执行器的姿态与动作指令。数据以分块存储的Parquet格式组织，确保了高效存取与大规模处理的可行性。

特点

该数据集的核心特点在于其多模态数据的紧密对齐与结构化表征。视觉观测部分包含224x224分辨率的RGB图像流，分别从基座和腕部视角提供丰富的场景信息。状态观测与动作空间均以七维向量形式呈现，精确刻画了末端执行器的位置、旋转及夹爪开合状态。数据集采用统一的时空索引机制，通过时间戳、帧索引与片段索引实现数据的高效检索与序列重建，为模仿学习与强化学习算法提供了标准化的输入输出接口。

使用方法

使用该数据集时，研究者可通过LeRobot提供的数据加载接口直接读取Parquet格式的文件。数据集已预分为训练集，涵盖全部1000个操作片段，适用于机器人操作策略的端到端训练。每个数据样本包含同步的图像观测、机器人状态及对应的动作指令，支持以片段为单位进行序列建模，也可按帧提取进行行为克隆。数据集的标准化特征定义使得其能够无缝接入主流机器人学习框架，为抓取放置任务的算法验证与比较提供基准。

背景与挑战

背景概述

在机器人操作领域，模仿学习与强化学习的发展亟需大规模、高质量的真实世界交互数据作为支撑。pick-place-UR5e-eef-eef数据集应运而生，由HuggingFace的LeRobot项目团队创建，旨在为UR5e机械臂的拾放任务提供端到端的学习资源。该数据集通过双视角视觉观测与末端执行器状态相结合，记录了机械臂在复杂环境中的精确操作轨迹，为机器人灵巧操作算法的训练与评估奠定了数据基础。其构建不仅推动了数据驱动机器人控制范式的进步，也为学术界与工业界在自动化抓取与放置任务上的研究提供了关键实验平台。

当前挑战

该数据集致力于解决机器人拾放任务中基于视觉的端到端策略学习挑战，其核心在于如何从高维视觉输入中有效提取特征，并生成精确的末端执行器动作序列。构建过程中的挑战尤为显著，包括多传感器数据的时空同步、大规模视频数据的高效压缩与存储，以及真实世界操作场景下数据采集的多样性与一致性平衡。此外，确保动作指令与观测状态之间的精确对应，避免噪声干扰，也是数据集构建中需要克服的技术难点。

常用场景

经典使用场景

在机器人操作领域，pick-place-UR5e-eef-eef数据集为机器人抓取与放置任务提供了丰富的真实世界交互数据。该数据集通过UR5e机械臂采集了1000个完整操作序列，包含多视角视觉观测与末端执行器状态信息，常用于训练端到端的机器人操作策略模型。研究者利用其高帧率视频流与精确的动作标注，能够模拟复杂环境下的抓取决策过程，为机器人自主操作算法的开发奠定数据基础。

衍生相关工作

围绕该数据集衍生的经典工作主要集中在机器人操作策略的泛化与迁移学习方面。许多研究利用其多视角视频序列开发视觉表征学习模型，以提升策略在未见物体上的适应性。同时，结合末端执行器状态数据的工作推动了动作空间建模的进展，为后续基于Transformer的序列决策框架提供了训练基准，持续影响着机器人学习社区的方法创新。

数据集最近研究