five

CoRL2026-CSI/teleop_ur7e_square

收藏
Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/CoRL2026-CSI/teleop_ur7e_square
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集与机器人和操作相关,特别是使用UR7e机器人。它包括来自两个视角(顶视图和腕部)的观察、动作和视频数据。数据集包含30个片段,47,157帧,并以parquet文件格式存储,附带相关的视频文件。特征包括机器人状态观察、动作、时间戳和帧索引。数据集使用LeRobot创建,但未提供数据集应用或收集方法的具体描述。

This dataset is related to robotics and manipulation, specifically using the UR7e robot. It includes observations, actions, and video data from two perspectives (topview and wrist). The dataset consists of 30 episodes, 47,157 frames, and is stored in parquet files with associated video files. The features include robot state observations, actions, timestamps, and frame indices. The dataset was created using LeRobot, but no specific description of the datasets application or collection method is provided.
提供机构:
CoRL2026-CSI
搜集汇总
数据集介绍
main_image_url
构建方式
在本数据集的构建过程中,研究团队依托LeRobot开源框架,以UR7e机械臂作为核心机器人平台开展遥操作数据采集。通过采集30个完整操作回合,获得了总计47157帧的时序数据,涵盖单一操作任务——方形轨迹跟踪。数据以Parquet格式高效存储于100MB的块文件中,并辅以200MB的同步视频记录,确保状态信息与视觉观测的精确对齐。每个样本包含7维关节状态(包括肩关节、肘关节、腕关节及夹爪位置)和对应的7维动作指令,来自俯视与腕部两个视角的RealSense摄像头以224×224分辨率、30帧/秒的速率录制视频,为模仿学习提供了丰富的观测信息。
特点
该数据集具备显著的结构化与多模态特性。它提供了高保真的机器人关节状态与动作空间,每一维度均具有明确物理含义(如shoulder_pan.pos),便于研究者理解机器人的运动学本质。视觉数据采用先进AV1视频编码压缩,在保证图像质量的同时优化存储效率。数据集统一以30Hz频率采样,并包含时间戳、帧索引等元数据,支持精确的时序分析。所有30个回合全部划分至训练集,无测试集预留,这种设计特别适用于预训练或数据增强场景,且采用分块存储策略,平衡了数据加载灵活性与文件管理便捷性。
使用方法
用户可直接利用LeRobot库加载此数据集,通过指定配置名称'default'与数据路径访问Parquet文件和视频资源。推荐使用Hugging Face提供的可视化工具预览操作回合,快速理解数据质量与任务结构。在模型训练中,可将7维关节观测作为策略网络输入,对应的7维动作作为监督信号,配合俯视与腕部视角图像进行端到端模仿学习。数据集已按照chunks_size=1000进行分块,支持流式加载,降低内存压力。对于需要大规模数据的研究,可将其作为基础数据集,结合其他同构数据进行多任务联合训练,拓展机器人操作技能的泛化能力。
背景与挑战
背景概述
随着机器人操作任务日益复杂,从人类演示中学习精细操控行为成为具身智能领域的关键研究方向。teleop_ur7e_square数据集由CoRL2026-CSI机构于近期创建,基于LeRobot框架采集,聚焦于UR7e机械臂的方形轨迹跟踪操控任务。该数据集包含30个演示回合、47157帧时序数据,记录了7自由度关节状态与对应的末端执行器动作,并同步提供了RGB视觉观测(顶置与腕部视角)。其核心研究问题在于建立从多模态感知(视觉与关节状态)到连续动作映射的端到端策略,为机器人模仿学习与行为克隆提供标准化的基准资源。该数据集以Apache-2.0协议开源,对促进重复性操控任务中的策略泛化研究具有重要推动作用。
当前挑战
该数据集面临的主要挑战包括:其一,在领域任务层面,机械臂的精准方形轨迹跟踪涉及非线性关节动力学与视觉反馈的实时融合,要求模型具备对微小运动偏差的鲁棒补偿能力,而现有模仿学习方法在处理此类连续精密操控时常因策略过拟合于特定演示分布而泛化不足。其二,在数据集构建过程中,需同步协调多传感器(两台Realsense相机与关节编码器)的高帧率数据流,确保视觉图像与运动状态在30 FPS下的时序对齐,同时手动遥操作引入的噪声与操作者习惯差异可能污染动作标签的一致性。此外,有限的任务种类(仅单一方形轨迹)与30个演示样本量,制约了跨任务迁移学习及长程操控策略的验证有效性。
常用场景
经典使用场景
在机器人操作研究领域,teleop_ur7e_square数据集为模仿学习和行为克隆提供了宝贵的基准资源。该数据集记录了UR7e机械臂在遥操作模式下完成正方形轨迹追踪任务的完整过程,包含30个示范片段、逾4.7万帧时序数据,并同步采集了顶部与腕部双视角视觉影像。研究者能够利用这些高质量观测数据训练神经网络,使机器人学习从视觉输入到关节动作的端到端映射,从而复现操作技能。其结构化存储的关节状态与动作序列,尤其适合评估模型在精确轨迹跟随任务中的泛化能力。
实际应用
在实际工业场景中,此数据集可用于开发自适应装配与重复性物料搬运系统。基于UR7e机械臂的遥操作数据,工程师能够训练具备视觉伺服能力的自主作业模型,降低对人工编程的依赖。例如在电子元件插装或精密打磨工序中,机器人可通过学习数据集中的轨迹模式,实时调整末端执行器位置以应对工件公差变化。此外,该数据集的视频与状态对齐特性,还支持构建混合现实远程操控界面,提升人机协作效率。
衍生相关工作
基于该数据集风格与结构,研究者已展开多项衍生工作。LeRobot社区利用类似格式的数据评估了扩散策略与动作分块模型在机器人操作上的表现,揭示了多帧时序建模在轨迹平滑性上的优势。还有工作在此基础上引入因果推理框架,通过解耦视觉与动力学特征来提升策略的可解释性。更有团队开发了跨任务迁移算法,利用正方形轨迹的底层运动模式辅助学习多边形或曲线路径操作,验证了遥操作数据在构建通用技能基元中的潜力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作