YCB-Multicam-Dataset

github2021-10-15 更新2024-05-31 收录

下载链接：

https://github.com/Sefrin/ycb_multicam_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在评估不同3D传感器在机器人视觉领域中对物体识别的适用性。数据集包含32个场景，每个场景有20个来自YCB对象和模型集的物体，用于比较不同相机数据的6DOF姿态估计。数据集分为两部分，一部分是相机固定位置的记录，另一部分是相机在场景周围移动的记录。

This dataset is designed to evaluate the applicability of different 3D sensors in the field of robotic vision for object recognition. The dataset comprises 32 scenes, each containing 20 objects from the YCB Object and Model Set, aimed at comparing 6DOF pose estimation across various camera data. The dataset is divided into two parts: one consists of recordings with the camera in a fixed position, and the other includes recordings with the camera moving around the scene.

创建时间：

2018-10-31

原始信息汇总

数据集概述

数据集名称

YCB-Multicam-Dataset

数据集目的

用于评估和比较不同3D传感器在物体识别中的6DOF姿态估计性能。

数据集内容

场景数量：32个场景
包含物体：20个来自YCB Object and Model set的物体
传感器类型：
- 结构光传感器：ASUS Xtion Pro Live, Orbbec Astra
- 主动立体传感器：Ensenso N35, Intel RealSense R200
- 飞行时间传感器：Microsoft Kinect2, PMD CamBoard pico flexx*, Basler ToF Engineering Sample*
数据类型：
- 原始RGB/红外图像
- RGB/红外相机内参
- 原始深度图像
- 深度相机内参
- 注册到RGB/红外图像的点云
帧数：约8064帧来自快照，约47000帧来自轨迹记录

数据集结构

数据存储格式：ROS bag格式
文件结构：详见提供的图片文件结构图

数据集使用

数据获取方式：
- 第一部分：相机固定在九个位置，按顺序记录以避免传感器间干扰
- 第二部分：相机围绕场景移动，按顺序记录以避免传感器间干扰
数据集接口：提供Python 2.7接口，使用ROS，包含获取数据的函数和方法

数据集限制

不适用于神经网络训练，因数据存在背景和标记板的一致性，可能导致模型在其他数据上表现不佳。

数据集可视化

提供可视化代码，需配置路径并使用ROS进行操作

样本数据

提供多种传感器的深度数据及地面实况标注的样本图像

搜集汇总

数据集介绍

构建方式

YCB-Multicam-Dataset的构建旨在为机器人领域的计算机视觉研究提供多传感器数据，以便进行定量比较。该数据集包含32个场景，每个场景中选用了来自YCB对象和模型集的20个对象，并设计了两种数据采集方式：一种是在九个固定位置依次记录，以避免传感器之间的干扰；另一种是让每个摄像头沿轨迹移动并依次记录。所有场景均包含带有ArUco标记的标定板，用于提供相机间的参考坐标系和地面真值标注。

使用方法

使用YCB-Multicam-Dataset时，用户可通过提供的Python接口访问数据。该接口支持按摄像头名称、数据源（固定位置或轨迹）以及是否包含点云数据来筛选数据。数据集还提供了可视化工具，用户可通过ROS的launch文件启动可视化界面，并使用rqt_reconfigure工具调整场景和视角。由于数据集主要用于传感器性能评估而非神经网络训练，用户在使用时需注意其数据偏差问题，避免在非目标场景中应用训练模型。

背景与挑战

背景概述

YCB-Multicam-Dataset的创建源于机器人领域中计算机视觉技术的重要性，尤其是在3D传感器的选择与评估方面。该数据集由相关研究团队于2018年开发，旨在为不同3D传感器在物体识别任务中的性能提供定量比较的基础。数据集包含32个场景，涵盖了来自YCB物体与模型集的20个对象，并专注于六自由度（6DOF）姿态估计算法的评估。通过引入带有ArUco标记的标定板，数据集为多相机系统提供了共享的参考坐标系和精确的地面真值标注。这一设计不仅支持传感器间的标定，还为多视角数据融合提供了可靠的基础。YCB-Multicam-Dataset的发布推动了机器人视觉领域的研究，尤其是在多传感器融合与物体识别算法的优化方面。

当前挑战

YCB-Multicam-Dataset面临的挑战主要体现在两个方面。首先，在领域问题方面，尽管数据集为多传感器性能比较提供了丰富的数据，但其设计初衷并非用于训练深度学习模型。由于数据中存在显著的偏差（如相同的背景和标定板），基于此训练的模型可能在其他场景中表现不佳。其次，在数据集构建过程中，研究人员需克服多传感器同步与数据采集的复杂性。为避免传感器间的干扰，数据采集采用了顺序记录的方式，这增加了实验的复杂性和时间成本。此外，不同传感器的数据格式与精度差异也对数据对齐与标注提出了更高的技术要求。这些挑战为后续研究提供了改进方向，例如开发更高效的多传感器同步技术与更通用的数据标注方法。

常用场景

经典使用场景

YCB-Multicam-Dataset在机器人视觉领域中被广泛用于评估不同3D传感器在物体识别任务中的性能。该数据集通过提供多个传感器的同步数据，使得研究人员能够在相同的场景下进行传感器的定量比较，特别是在6自由度（6DOF）姿态估计任务中。数据集中的32个场景包含了20个YCB物体，每个场景都配备了多个传感器的数据，确保了实验的可重复性和一致性。

解决学术问题

YCB-Multicam-Dataset解决了在机器人视觉研究中常见的传感器选择问题。通过提供多种3D传感器的同步数据，研究人员能够直接比较不同传感器在物体识别和姿态估计任务中的表现。这不仅帮助学术界更好地理解不同传感器的优缺点，还为未来的传感器设计和算法优化提供了宝贵的参考数据。

实际应用

在实际应用中，YCB-Multicam-Dataset为工业机器人和服务机器人提供了重要的数据支持。例如，在自动化仓储系统中，机器人需要精确识别和定位物体，该数据集的多传感器数据可以帮助优化这些系统的感知模块。此外，数据集中的标定板和参考帧也为多传感器融合技术提供了基础，提升了机器人在复杂环境中的感知能力。

数据集最近研究