cupnb/ur10e_real_cube_merge_no_joints

Name: cupnb/ur10e_real_cube_merge_no_joints
Creator: cupnb
Published: 2026-04-30 14:44:35
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/cupnb/ur10e_real_cube_merge_no_joints

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人技术领域。数据集包含357个episodes，334477帧，4个任务，数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集的特征包括动作（线性速度、角速度、夹持器位置）、观察图像（三个摄像头的视频数据）、时间戳、帧索引、episode索引、索引、任务索引和观察状态（位置和四元数）。数据文件以parquet格式存储，视频文件以mp4格式存储。数据集采用apache-2.0许可证。

This dataset was created by LeRobot and is primarily used in the field of robotics. The dataset contains 357 episodes, 334477 frames, and 4 tasks, with data files sized at 100MB and video files at 200MB, running at 30fps. The features include actions (linear velocity, angular velocity, gripper position), observation images (video data from three cameras), timestamp, frame index, episode index, index, task index, and observation state (position and quaternion). Data files are stored in parquet format, and video files are stored in mp4 format. The dataset is licensed under apache-2.0.

提供机构：

cupnb

搜集汇总

数据集介绍

构建方式

该数据集基于LeRobot框架构建，旨在为机器人操控任务提供标准化的训练与评估资源。数据采集于真实环境中的UR10e机械臂，通过多视角视觉传感与状态记录系统同步捕获高保真观测信息。数据集包含357个独立轨迹片段，总计超过33万帧，覆盖4种不同任务类型，所有数据均以30帧每秒的速率存储。原始观测数据包括三台摄像头的视频流（分辨率分别为1280×720与720×1280）以及机械臂末端执行器的七维位姿状态，动作空间则定义了六维速度指令与一维夹爪位置。数据以Parquet格式按固定块大小分片存储，视频文件则采用高效AV1编码压缩，兼顾存储效率与回放质量。整个数据集未划分验证集或测试集，全部片段统一归入训练集，便于端到端策略的集中学习。

特点

该数据集的核心特色在于其多模态高保真融合特性，真实物理环境下的UR10e机械臂操控数据为模仿学习与强化学习提供了极具价值的基准。三台不同角度摄像机同时录制，辅以机械臂全状态位姿信息，构成了丰富的视觉-状态联合观测空间。动作空间直接包含线速度与角速度等连续控制量，完美适配机器人运动学模型的直接学习需求。数据量庞大，357条轨迹与33万帧的规模足以覆盖多样化的操作场景与物体交互模式，同时保持30帧的流畅时间分辨率。此外，采用Apache 2.0开源许可发布，无障碍的知识共享环境极大降低了研究者复现与扩展工作的门槛，促进了机器人领域算法开发的透明性与可持续性。

使用方法

数据集专为基于LeRobot生态系统的机器人学习任务而设计，推荐通过Hugging Face上的可视化工具进行预览和初步分析。使用时，可直接加载默认配置，通过读取Parquet格式数据文件与MP4视频文件，获取完整的观测-动作时间序列。训练过程中，每帧数据包含多摄像头图像、机器人状态（位置与姿态四元数）、时间戳及任务索引，便于构建端到端策略网络。建议将全部357条轨迹用于监督学习，以学习从状态空间到动作空间的映射，或用于离线强化学习中的行为克隆与值函数估计。数据以1000帧为一个块进行组织，便于批量加载与随机打乱，提升深度学习框架下的数据处理效率。音频与深度图信息未被包含，故不适合需要三维几何感知或多模态音频融合的研究场景。

背景与挑战

背景概述

ur10e_real_cube_merge_no_joints数据集由Hugging Face的LeRobot团队构建，依托于开源机器人学习框架LeRobot，旨在为机器人操作任务提供高质量的演示数据。该数据集创建于2023年，核心研究问题集中于如何利用多视角视觉输入与关节状态信息，实现机器人对立方体物体的精准操控。数据集包含来自UR10e机械臂的357个演示片段，覆盖4类操作任务，共计33万余帧，配备了三个不同角度的摄像头（分辨率最高达1280×720）以及末端执行器位姿与速度等状态信息。作为LeRobot生态系统的组成部分，该数据集推动了模仿学习与行为克隆在真实机器人场景中的基准测试，对于降低机器人数据获取门槛、促进可复现研究具有重要价值。

当前挑战

当前领域面临的首要挑战在于多模态传感信息的有效融合与精确行为映射。尽管数据集提供了丰富的视觉与状态信息，但如何从高维图像序列中提取鲁棒的特征，并使其与机械臂的连续动作空间形成稳定的决策策略，仍是模仿学习中的核心难点。构建过程中，数据采集面临物理硬件固有噪声、不同任务间动作分布差异大以及演示质量一致性难以保证等问题。此外，摄像头视角的固定化带来了观测空间的局限性，而动作空间中仅包含线速度、角速度与夹爪位置等7维参数，缺乏关节力矩信息，限制了模型对精细力控操作的泛化能力。数据规模（约100MB的Parquet文件与200MB的视频文件）虽适中，但远不足以覆盖复杂环境中的长尾分布情况。

常用场景

经典使用场景

在机器人操作与模仿学习领域，ur10e_real_cube_merge_no_joints数据集为研究机械臂的精准操控提供了宝贵的资源。该数据集记录了UR10e协作机器人在真实物理环境下操作立方体物体的完整轨迹，涵盖多视角视觉观测（三台不同角度摄像头）、机器人末端执行器位姿状态以及速度级控制指令。凭借其包含的357个演示回合与33万余帧高分辨率视频数据，它成为训练视觉运动策略、开展行为克隆与离线强化学习的理想基准。研究者可借助此数据集，探索如何使机器人从人类演示中习得精细抓取与放置策略，推动机器人从预设编程向数据驱动的自主学习范式转变。

解决学术问题

该数据集直面机器人学习中的核心学术挑战——如何在真实世界中实现从视觉输入到动作输出的高效映射。它解决了传统仿真环境与真实物理之间存在‘仿真鸿沟’的难题，为研究域随机化与策略泛化能力提供了真实数据支撑。通过提供多相机视角和连续动作序列，该数据集支持研究者深入探索高维视觉表征与低层级速度控制之间的耦合关系，并有助于攻克模仿学习中的协变量偏移困境。其公开可复现的特性，促进了机器人操作领域可比较性研究的繁荣，加速了用于物体操纵的端到端学习理论的成熟与完善。

衍生相关工作

该数据集催生了一系列围绕机器人技能复现与泛化的经典工作。基于此数据，研究人员开发了融合注意力机制的多模态视觉运动策略网络，显著提升了在遮挡或光照变化条件下的抓取成功率。部分工作专注于利用该数据集训练扩散策略模型，以生成更加平滑且符合物理约束的机械臂轨迹。同时，该数据集推动了因果推理在机器人领域的交叉探索，研究者尝试从中提取对象交互的关键因果结构，以实现零样本或小样本下的跨场景能力迁移。这些衍生工作不仅深化了对模仿学习内在机理的理解，还启发了下一代即插即用式机器人控制系统架构的设计。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集