ur10e_real_easy_pick_cube
收藏Hugging Face2026-01-09 更新2026-01-10 收录
下载链接:
https://huggingface.co/datasets/cupnb/ur10e_real_easy_pick_cube
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个机器人相关的数据集,使用LeRobot工具创建。数据集包含100个episodes,共58478帧数据,使用ROS2机器人系统。数据集中包含动作数据(如线速度和角速度)、观测数据(如关节位置)、以及来自三个不同摄像头的视频数据。视频数据的分辨率分别为1280x720和720x1280,编码格式为AV1,帧率为30fps。数据集以parquet格式存储,总数据文件大小为100MB,视频文件大小为200MB。
创建时间:
2026-01-09
原始信息汇总
数据集概述:ur10e_real_easy_pick_cube
基本信息
- 数据集名称:ur10e_real_easy_pick_cube
- 创建工具:LeRobot
- 许可证:Apache-2.0
- 任务类别:机器人学
- 标签:LeRobot
数据集规模
- 总情节数:100
- 总帧数:58,478
- 总任务数:1
- 数据块大小:1000
- 数据文件总大小:100 MB
- 视频文件总大小:200 MB
- 帧率:30 FPS
- 数据划分:训练集(0:100)
数据结构与特征
数据以Parquet文件格式存储,路径模式为:data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频以MP4文件格式存储,路径模式为:videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据特征详情
-
动作
- 数据类型:float32
- 维度:[7]
- 特征名:
- linear_x.vel
- linear_y.vel
- linear_z.vel
- angular_x.vel
- angular_y.vel
- angular_z.vel
- gripper.pos
-
观测状态
- 数据类型:float32
- 维度:[7]
- 特征名:
- shoulder_pan_joint.pos
- shoulder_lift_joint.pos
- elbow_joint.pos
- wrist_1_joint.pos
- wrist_2_joint.pos
- wrist_3_joint.pos
- robotiq_hande_left_finger_joint.pos
-
观测图像(camera1)
- 数据类型:视频
- 分辨率:1280(高)x 720(宽)x 3(通道)
- 视频信息:
- 编码:AV1
- 像素格式:yuv420p
- 非深度图
- 帧率:30 FPS
- 通道数:3
- 无音频
-
观测图像(camera2)
- 数据类型:视频
- 分辨率:720(高)x 1280(宽)x 3(通道)
- 视频信息:
- 编码:AV1
- 像素格式:yuv420p
- 非深度图
- 帧率:30 FPS
- 通道数:3
- 无音频
-
观测图像(camera3)
- 数据类型:视频
- 分辨率:720(高)x 1280(宽)x 3(通道)
- 视频信息:
- 编码:AV1
- 像素格式:yuv420p
- 非深度图
- 帧率:30 FPS
- 通道数:3
- 无音频
-
时间戳
- 数据类型:float32
- 维度:[1]
-
帧索引
- 数据类型:int64
- 维度:[1]
-
情节索引
- 数据类型:int64
- 维度:[1]
-
索引
- 数据类型:int64
- 维度:[1]
-
任务索引
- 数据类型:int64
- 维度:[1]
技术细节
- 代码库版本:v3.0
- 机器人类型:ros2
搜集汇总
数据集介绍

构建方式
在机器人操作领域,真实世界数据的采集对于提升模型泛化能力至关重要。ur10e_real_easy_pick_cube数据集通过LeRobot平台,利用UR10e机械臂在真实物理环境中执行拾取立方体的任务构建而成。数据采集过程涵盖了100个完整操作片段,总计生成58478帧同步记录,以30帧每秒的速率捕获机械臂关节状态、末端执行器动作以及多视角视觉信息。原始数据经过结构化处理,存储为Parquet格式文件,并辅以对应的高清视频流,确保了时序对齐与数据完整性。
特点
该数据集的核心特征在于其多模态与高同步性的数据组织。它系统整合了七维关节位置状态、七维动作指令(包含线速度、角速度及夹爪位置)以及来自三个独立摄像头的视觉观测,分别提供1280x720与720x1280分辨率的RGB图像。数据以分块形式存储,每块包含1000帧,便于高效流式加载。所有传感器数据均带有精确的时间戳与帧索引,支持对连续操作序列的精细分析,为模仿学习与强化学习算法提供了丰富的真实交互轨迹。
使用方法
研究人员可通过Hugging Face数据集库直接加载此数据集,利用其预定义的数据分割(全部100个片段用于训练)进行模型训练与评估。数据以字典形式访问,关键字段包括动作、观测状态、多视角图像及元数据索引。得益于Parquet格式与分块设计,能够灵活支持大规模数据流的迭代读取。该数据集适用于开发端到端的机器人操作策略,尤其可用于训练视觉运动控制模型,或作为真实世界机器人学习任务的基准测试资源。
背景与挑战
背景概述
在机器人操作领域,真实世界数据的稀缺性长期制约着模仿学习与强化学习算法的实际部署。ur10e_real_easy_pick_cube数据集应运而生,它由Hugging Face的LeRobot项目团队创建,旨在为机器人抓取与操作任务提供高质量的真实环境演示数据。该数据集聚焦于使用UR10e机械臂执行简单的拾取立方体任务,通过整合多视角视觉观测、精确的关节状态与连续动作指令,为研究社区构建了一个弥合仿真与物理世界差距的宝贵资源。其结构化设计支持端到端策略学习,有望推动机器人灵巧操作技术的实用化进展。
当前挑战
该数据集致力于解决机器人模仿学习中从演示数据学习泛化策略的核心挑战,其难点在于真实世界传感器噪声、动态环境变化以及动作与状态间复杂的非线性映射关系。在构建过程中,团队面临多重工程挑战:确保多路高清视频流与高精度控制指令的严格时间同步;在长时间数据采集中维持机器人系统与传感装置的稳定运行;以及处理大规模异构数据(包括图像、状态与动作)的高效存储与快速读取。这些挑战的克服是产出可靠、一致数据集的关键。
常用场景
经典使用场景
在机器人操作学习领域,ur10e_real_easy_pick_cube数据集为机械臂抓取任务提供了真实世界的交互数据。该数据集通过UR10e机器人执行简单的立方体拾取操作,记录了多视角视觉观测、关节状态与动作指令,成为训练端到端模仿学习或强化学习模型的经典资源。研究者可利用其丰富的传感器信息,模拟从感知到控制的完整闭环,验证算法在真实环境中的泛化能力与鲁棒性。
实际应用
在实际工业自动化场景中,ur10e_real_easy_pick_cube数据集能够指导仓储分拣、装配线上下料等任务的智能系统开发。基于其记录的真实抓取轨迹,工程师可优化机械臂控制策略,提升在非结构化环境中的操作精度与效率,为柔性制造与物流机器人系统的部署提供可靠的数据支撑。
衍生相关工作
围绕该数据集,已衍生出多项专注于真实世界机器人学习的经典研究。例如,结合LeRobot框架的算法改进工作,利用多模态观测数据训练端到端策略网络;亦有研究探索基于该数据集的离线强化学习方法,以提升在稀疏奖励环境下的样本利用率,推动了真实机器人操作任务的算法创新与工程实践。
以上内容由遇见数据集搜集并总结生成



