YCB-M

Name: YCB-M
Creator: 德国人工智能研究中心
Published: 2020-09-29 15:58:18
License: 暂无描述

arXiv2020-09-29 更新2024-06-21 收录

下载链接：

https://doi.org/10.5281/zenodo.2579172

下载链接

链接失效反馈

官方服务：

资源简介：

YCB-M数据集是由德国人工智能研究中心创建，包含32个场景，共49,294帧，使用7种不同3D相机捕捉，主要用于对象识别和6自由度姿态估计。数据集包含20种来自YCB对象和模型集的常见对象，提供完整的6自由度姿态地面实况、逐像素分割、2D和3D边界框以及每个对象的遮挡量度。该数据集旨在支持对象识别和姿态估计的研究，并允许研究人员在选择特定任务的相机前对不同相机和深度传感技术进行定量比较。

The YCB-M dataset was developed by the German Research Center for Artificial Intelligence, consisting of 32 scenes totaling 49,294 frames which were captured using 7 distinct 3D cameras. It is primarily intended for object recognition and 6-degree-of-freedom (6DoF) pose estimation. The dataset includes 20 common objects from the YCB Object and Model Set, and provides complete 6DoF pose ground truth, pixel-wise segmentation masks, 2D and 3D bounding boxes, as well as occlusion metrics for each object. This dataset aims to support research on object recognition and pose estimation, and enables researchers to quantitatively compare different cameras and depth sensing technologies prior to selecting task-specific cameras.

提供机构：

德国人工智能研究中心

创建时间：

2020-04-24

搜集汇总

数据集介绍

构建方式

在机器人视觉领域，多传感器数据融合对于提升算法鲁棒性至关重要。YCB-M数据集的构建采用了系统性采集策略，通过将七种不同技术原理的3D相机（涵盖结构光、飞行时间和主动立体视觉）固定于UR-5机械臂末端，在32个场景中沿预设轨迹采集数据。为避免红外光谱干扰，采集过程分为两个阶段：静态锚点逐相机轮询拍摄与动态轨迹单相机连续录制，最终获得包含20类YCB物体的49,294帧同步RGB-D数据。所有场景均放置ArUco标记板作为全局坐标系基准，并通过半自动标注流程生成高精度6DoF姿态真值。

特点

该数据集的核心价值在于其多相机异构架构带来的泛化评估能力。七种相机覆盖消费级到工业级设备，深度感知技术差异显著，为研究相机特性对算法性能的影响提供了直接对比基础。数据标注体系完备，除6DoF姿态外，还提供像素级分割掩码、二维与三维边界框及遮挡可见度量化指标，其标注格式与FAT合成数据集兼容，支持跨数据集迁移研究。场景设计注重现实复杂性，物体布局包含不同程度遮挡与光照变化，模拟了真实机器人操作环境中的视觉挑战。

使用方法

研究者可利用该数据集进行多维度算法验证与传感器评估。在姿态估计领域，可通过对比同一算法在不同相机数据上的性能差异，分析传感器噪声、分辨率等技术参数对算法鲁棒性的影响。数据集支持端到端训练，其提供的网格模型与真值可直接用于深度学习模型的监督训练。此外，多模态特性允许开展RGB与深度信息融合方法的研究，而丰富的标注类型也拓展了其在语义分割、三维检测等衍生任务中的应用潜力。数据集的标准化格式便于集成至现有评估框架，为机器人视觉系统的传感器选型与算法优化提供实证依据。

背景与挑战

背景概述

在机器人视觉领域，物体识别与六自由度姿态估计是推动自主操作与场景理解的核心任务。YCB-M数据集由德国人工智能研究中心（DFKI）与奥斯纳布吕克大学的研究团队于2020年共同创建，旨在应对多相机RGB-D数据在算法评估中的空白。该数据集以YCB物体与模型集为基础，通过七种不同三维相机采集了32个场景的49,294帧数据，涵盖了结构光、飞行时间与主动立体视觉等主流深度感知技术。其核心研究问题聚焦于评估姿态估计算法对不同相机特性的敏感性，并为机器人任务中的相机选择提供量化依据，从而促进跨传感器鲁棒性算法的发展，对机器人感知与操作研究产生了深远影响。

当前挑战

YCB-M数据集致力于解决物体识别与六自由度姿态估计领域的关键挑战，即算法在不同深度相机技术下的泛化能力不足问题。具体而言，由于相机在传感原理、视野范围与噪声特性上的差异，单一相机数据集难以全面评估算法在实际多传感器环境中的鲁棒性。在构建过程中，研究团队面临多重挑战：首先，为避免多相机同时采集时的红外光谱干扰，需设计分阶段数据采集策略，增加了实验复杂度；其次，基于标记板的相机姿态估计存在精度局限，需通过合成点云匹配进行精细化校正，以确保地面真值姿态的准确性；此外，数据标注涉及大规模手动修正与自动化渲染的结合，对计算资源与流程优化提出了较高要求。

常用场景

经典使用场景

在机器人视觉领域，多传感器融合已成为提升环境感知鲁棒性的关键路径。YCB-M数据集通过整合七种不同三维相机的RGB-D数据，为物体识别与六自由度姿态估计任务提供了跨传感器的基准测试平台。其经典使用场景在于评估算法对相机型号的敏感性，助力开发独立于特定硬件的通用性模型，从而推动视觉系统在多样化硬件配置下的稳定表现。

实际应用

在实际机器人应用中，YCB-M数据集支持从工业自动化到家庭服务机器人的广泛场景。例如，在自主抓取任务中，利用该数据集可训练系统适应不同相机的深度噪声特性，提升在多变光照与遮挡条件下的操作成功率。同时，数据集的多相机配置为移动机器人平台选择合适传感器提供了决策依据，降低了硬件选型与集成成本，加速了视觉引导机器人的实际部署进程。

衍生相关工作

基于YCB-M数据集，研究者已展开多项延伸工作。例如，将DOPE等先进姿态估计算法适配至不同相机模型，揭示了RGB图像分辨率对识别性能的影响机制。此外，该数据集启发了跨模态融合方法的研究，如结合深度信息优化RGB-based算法的鲁棒性。这些工作不仅拓展了多相机视觉系统的理论框架，还为后续开发如实时语义分割、三维重建等任务提供了宝贵的跨传感器基准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集