leros2-ur10e-cube
收藏Hugging Face2026-01-22 更新2026-01-23 收录
下载链接:
https://huggingface.co/datasets/ngres/leros2-ur10e-cube
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过LeRobot创建的,主要用于机器人技术领域。数据集包含2个episodes,1142帧,1个任务,数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据集的结构包括动作(8维浮点数)、观察状态(14维浮点数)、基础图像和手腕图像(均为480x640x3的视频数据)、时间戳、帧索引、episode索引、索引和任务索引。机器人类型为ure,数据以parquet文件格式存储。
This dataset was developed using LeRobot, primarily targeting the robotics domain. It comprises 2 episodes, 1142 total frames, and 1 task. The aggregate size of the data files is 100 MB, while the video files total 200 MB, with a frame rate of 30 fps. The dataset structure includes 8-dimensional floating-point action data, 14-dimensional floating-point observation state data, base-view images and wrist-view images (both are 480×640×3 formatted video data), timestamps, frame indices, episode indices, indices, and task indices. The target robot type is ure, and the data is stored in Parquet file format.
创建时间:
2026-01-22
原始信息汇总
数据集概述
基本信息
- 数据集名称: leros2-ur10e-cube
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集结构
- 总情节数: 2
- 总帧数: 1142
- 总任务数: 1
- 数据块大小: 1000
- 数据文件总大小: 100 MB
- 视频文件总大小: 200 MB
- 帧率: 30 FPS
- 数据分割: 训练集包含所有情节 (0:2)
- 数据文件路径模式:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径模式:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4 - 代码库版本: v3.0
- 机器人类型: ure
数据特征
动作
- 数据类型: float32
- 形状: [8]
- 特征名:
- pose_x.pos
- pose_y.pos
- pose_z.pos
- pose_x.quat
- pose_y.quat
- pose_z.quat
- pose_w.quat
- gripper.pos
观测状态
- 数据类型: float32
- 形状: [14]
- 特征名:
- ur_shoulder_pan_joint.pos
- ur_shoulder_lift_joint.pos
- ur_elbow_joint.pos
- ur_wrist_1_joint.pos
- ur_wrist_2_joint.pos
- ur_wrist_3_joint.pos
- gripper.pos
- pose_x.pos
- pose_y.pos
- pose_z.pos
- pose_x.quat
- pose_y.quat
- pose_z.quat
- pose_w.quat
观测图像 (基座相机)
- 数据类型: 视频
- 形状: [480, 640, 3]
- 维度名: 高度, 宽度, 通道数
- 视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30
- 通道数: 3
- 包含音频: 否
观测图像 (腕部相机)
- 数据类型: 视频
- 形状: [480, 640, 3]
- 维度名: 高度, 宽度, 通道数
- 视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30
- 通道数: 3
- 包含音频: 否
元数据
- 时间戳: 数据类型 float32,形状 [1]
- 帧索引: 数据类型 int64,形状 [1]
- 情节索引: 数据类型 int64,形状 [1]
- 索引: 数据类型 int64,形状 [1]
- 任务索引: 数据类型 int64,形状 [1]
引用信息
- 主页: 未提供
- 论文: 未提供
- BibTeX 引用格式: 未提供
搜集汇总
数据集介绍

构建方式
在机器人操作领域,数据集的构建往往依赖于真实的物理交互过程。leros2-ur10e-cube数据集通过LeRobot框架,在UR10e机械臂平台上采集了与立方体交互的操作数据。该数据集以30帧每秒的速率记录了两个完整操作片段,共计1142帧数据,并以分块Parquet文件格式存储,确保了数据的高效访问与处理。视频数据采用AV1编码,分别从基座和腕部视角捕捉了480x640分辨率的RGB图像,同步记录了机械臂关节状态、末端执行器位姿及夹爪位置等多维观测信息。
特点
该数据集的核心特点在于其多模态与高结构化的数据组织形式。它不仅提供了双视角的视觉流,还深度融合了机器人的状态信息,包括14维的关节与末端位姿观测以及8维的动作指令。数据字段经过精心设计,具备明确的名称、数据类型与形状定义,便于机器学习模型直接解析与利用。所有数据均以时间戳、帧索引和片段索引进行严格对齐,确保了时序一致性,为模仿学习与强化学习算法提供了高质量的训练素材。
使用方法
研究人员可利用该数据集进行机器人操作策略的学习与验证。通过加载Parquet格式的数据文件,可以便捷地访问同步的观测-动作对。视觉数据以视频文件形式独立存储,可通过指定路径进行读取。数据集已预设训练划分,用户可直接用于训练端到端的策略模型或进行行为克隆等实验。在使用时,需注意遵循Apache 2.0许可协议,并合理引用相关资源以促进学术规范的遵守。
背景与挑战
背景概述
在机器人学习领域,高质量的真实世界交互数据集对于推动模仿学习与强化学习算法的发展至关重要。leros2-ur10e-cube数据集由HuggingFace的LeRobot项目团队创建,旨在为UR10e机械臂操作立方体任务提供详尽的示范数据。该数据集通过记录机械臂的关节状态、末端执行器位姿以及多视角视觉信息,构建了一个包含动作、观测与时间戳的结构化序列,为研究机器人灵巧操作与任务泛化能力提供了宝贵的实验基础。尽管其具体创建时间与核心论文信息尚未公开,但作为开源机器人数据集生态的一部分,它显著降低了学术界与工业界获取真实机器人操作数据的门槛,促进了数据驱动机器人控制方法的创新与验证。
当前挑战
该数据集致力于解决机器人操作任务中的模仿学习与策略泛化挑战,其核心问题在于如何从有限的示范数据中学习鲁棒且可迁移的控制策略。构建过程中面临多重挑战:首先,真实机器人数据采集需协调硬件同步与传感器校准,确保多模态数据(如关节角度、视觉视频)在时间上精确对齐;其次,数据标注与结构化处理涉及大规模高维序列的存储与索引,需平衡数据分辨率与存储效率;此外,示范数据的多样性与覆盖度有限,仅包含单一任务(立方体操作)和少量演示片段,可能制约模型在复杂场景或新物体上的泛化能力。这些挑战共同指向了机器人学习数据集的规模扩展、质量保证与任务多样性等关键研究方向。
常用场景
经典使用场景
在机器人操作学习领域,leros2-ur10e-cube数据集为UR10e机械臂的立方体抓取任务提供了丰富的多模态数据。该数据集通过整合关节状态、末端执行器姿态、夹爪位置以及来自基座和腕部摄像头的视觉信息,构建了一个完整的机器人感知-动作闭环。研究人员能够利用这些数据训练端到端的强化学习或模仿学习模型,探索在复杂环境中如何基于视觉输入生成精确的机械臂控制指令。
实际应用
在实际工业自动化与物流分拣场景中,基于此数据集开发的模型能够直接赋能UR系列协作机器人。通过学习数据中蕴含的抓取策略,机器人可以更智能地识别、定位并抓取传送带或工作台上的规则物体(如立方体),减少对精密预编程的依赖,提升生产线的柔性与部署效率。这为小批量、多品种的柔性制造提供了可行的技术路径。
衍生相关工作
围绕leros2-ur10e-cube这类机器人操作数据集,学术界衍生出了一系列经典研究工作。例如,基于视觉的端到端操作策略学习、多模态表征融合方法、以及从演示中提取技能的分层强化学习框架。这些工作通常以该数据集为基准,验证其在稀疏奖励、部分观测等挑战下的性能,进而推动了机器人学习算法在样本效率、安全性与可解释性方面的持续进步。
以上内容由遇见数据集搜集并总结生成



