MR6D
收藏arXiv2025-08-19 更新2025-08-22 收录
下载链接:
https://huggingface.co/datasets/anas-gouda/mr6d
下载链接
链接失效反馈官方服务:
资源简介:
MR6D数据集是为移动机器人在工业环境中的6D位姿估计而设计的。它包含92个真实场景,涉及16个独特物体的静态和动态交互。该数据集捕捉了移动平台特有的挑战,包括远距离视图、不同的物体配置、更大的物体尺寸以及复杂的遮挡/自遮挡模式。MR6D为开发和评估针对移动机器人需求的位姿估计方法提供了基础。
提供机构:
德国多特蒙德工业大学, 弗劳恩霍夫物流研究院, LAMARR机器学习研究所
创建时间:
2025-08-19
搜集汇总
数据集介绍

构建方式
在工业移动机器人感知研究领域,MR6D数据集的构建采用了多环境多视角采集策略,涵盖静态与动态交互场景。其构建过程依托高精度运动捕捉系统(VICON)与结构光深度相机(RealSense D435i/L515),通过手眼标定与多视角三维重建技术生成精确的6D位姿标注。动态场景通过人工交互模拟真实作业环境,静态场景则采用半自动标注流程,结合机器人里程计与SFM算法进行尺度恢复与位姿优化,最终通过BOP工具链完成标注验证。
特点
MR6D的核心特征体现在其面向工业移动机器人的专有性:包含16类大尺度标准化物体(如欧标托盘与仓储容器),平均检测距离达2.5米,远超传统家居物体数据集。数据涵盖92个场景,包含极端视角、长距离检测、动态遮挡及自遮挡等挑战性条件,且提供高质量三维网格模型。其标注体系支持实例级位姿估计,并包含相同颜色物体的密集堆叠配置,显著提升了分割与位姿估计的难度。
使用方法
该数据集适用于未见物体6D位姿估计的评估与算法开发,支持两种典型流程:其一是结合真实2D掩码与位姿估计模型(如FoundationPose)的评估模式;其二是全未见管道,依赖分割模型(如CTL或SegmentAnything2)生成掩码后输入位姿估计网络。评估需遵循BOP基准指标(如平均召回率AR),重点关注长距离、遮挡及视角变化下的泛化性能。数据集可通过HuggingFace平台获取,支持合成数据生成以扩展训练集。
背景与挑战
背景概述
随着移动机器人在工业环境中的广泛应用,六维姿态估计技术成为实现精准物体定位与操作的核心挑战。传统数据集如YCB-V和T-LESS主要面向机械臂操纵的小型家居物体,难以满足移动机器人对远距离、大尺度物体的感知需求。2025年由多特蒙德工业大学与弗劳恩霍夫物流研究所联合发布的MR6D数据集,首次针对工业移动机器人场景设计,包含16类标准化物体(如欧标托盘和仓储容器)在静态与动态交互中的92组真实场景数据。该数据集通过模拟高速全向移动与自平衡机器人等典型工业平台,填补了远距离检测、极端视角及自遮挡等关键领域的空白,为移动机器人感知研究提供了更贴近实际的基准测试框架。
当前挑战
MR6D数据集着力解决工业移动机器人场景中两大核心挑战:在领域问题层面,需应对远距离探测(平均距离达2.5米)、极端摄像机视角(包括低角度仰视与平视)以及复杂自遮挡模式导致的姿态估计偏差,这些因素显著区别于传统机械臂的固定俯视视角;在构建过程中,动态场景需同步追踪摄像机与运动物体,通过运动捕捉系统与多校准策略消除标定误差,而室外场景因阳光干扰导致深度传感器失效,需结合机器人里程计与三维重建技术进行尺度恢复与手动标注优化,确保厘米级标注精度。
常用场景
经典使用场景
在移动机器人感知研究中,MR6D数据集被广泛应用于评估6D位姿估计算法在工业环境中的泛化能力。该数据集通过模拟真实场景中的长距离检测、极端视角和自遮挡等挑战,为研究者提供了标准化测试平台。其典型使用场景包括基于未见对象的位姿估计 pipeline 验证,以及分割模型与位姿估计模型的联合性能分析。
实际应用
该数据集直接服务于工业移动机器人的实际应用,包括仓储物流中的托盘定位、自动化仓库的货箱抓取,以及动态人机协作场景下的物体交互。通过模拟evoBOT等自平衡机器人和O3dyn全向移动机器人的作业视角,为高精度导航、抓取规划等核心功能提供了感知基础,显著提升了在真实光照变化和深度传感器退化条件下的系统鲁棒性。
衍生相关工作
基于MR6D的特性,衍生出两类代表性研究:一是针对长距离位姿估计的深度补全方法,如结合单目深度估计与背景去除的分割增强技术;二是动态场景下的多目标跟踪框架,通过运动捕捉系统与视觉算法的融合提升遮挡处理能力。这些工作推动了BOP基准指标的演进,促进了面向移动机器人的实体级分割等新研究方向。
以上内容由遇见数据集搜集并总结生成



