Realworld_dataset_capturer

github2022-08-21 更新2024-05-31 收录

下载链接：

https://github.com/Chuanfang-Neptune/Realworld_dataset_capturer

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由UR5机器人辅助自动创建，包含RGB图像、深度图像、分割掩码和相机及训练对象的6D姿态，用于训练深度学习模型。

This dataset was automatically generated with the assistance of a UR5 robotic arm, encompassing RGB images, depth images, segmentation masks, and the 6D poses of both the camera and the training objects, intended for the training of deep learning models.

创建时间：

2020-05-14

原始信息汇总

数据集概述

数据集内容

RGB图像：用于捕捉训练对象的视觉信息。
深度图像：提供训练对象的深度信息。
分割掩码：用于对象的实例/分割。
6D姿态：包括相机和训练对象的6D姿态信息。

数据采集方法

使用Intel D435传感器，通过UR5机器人臂在移动平台上围绕训练对象移动，自动捕捉RGB和深度图像。
实时计算对象的6D姿态、分割掩码和3D边界框。

数据集结构

Json文件（x.json）：存储相机和对象的6D姿态，以及3D边界框的顶点位置。
掩码图像（xs.jpg）：存储训练对象的分割掩码。
RGB图像（xr.png）：存储从虚拟或真实传感器捕捉的RGB图像。
深度图像（xd.png）：存储从虚拟或真实传感器捕捉的深度图像。

系统要求

操作系统：Ubuntu 16.04
ROS版本：Kinetic
依赖软件：Freeglut 3.x, Freeimage 3.x

用户指南

构建代码：确保所有依赖项准备就绪，并构建源代码。
设置相机：校准相机以获取内在矩阵，并配置相机的偏移和主题。
准备训练对象：创建训练对象的模型，并将其导出为DAE和STL格式。
设置实验环境：固定机器人基础，并测量其相对于地面的偏移。
运行机器人：启动RVIZ和相机节点，运行机器人程序以开始数据捕捉。

数据存储

捕捉的数据集将存储在{YOUR_WORKING_FOLDER}/data/json目录中。

搜集汇总

数据集介绍

构建方式

Realworld_dataset_capturer数据集的构建依赖于UR5机械臂与Intel D435传感器的协同工作。机械臂搭载传感器在移动平台上围绕目标物体进行多角度拍摄，实时采集RGB图像、深度图像、分割掩码以及物体的6D姿态信息。通过机器人关节状态与相机矩阵的实时计算，生成物体的3D边界框和实例分割掩码，确保数据的精确性和多样性。

特点

该数据集以其多维度的数据采集方式脱颖而出，不仅包含RGB和深度图像，还提供了精确的6D姿态信息、实例分割掩码以及3D边界框数据。这些数据为深度学习模型的训练提供了丰富的输入特征，尤其适用于目标检测、姿态估计和三维重建等任务。数据集的结构化存储方式（如JSON文件和图像文件）便于后续的数据处理和分析。

使用方法

使用Realworld_dataset_capturer数据集时，用户需首先配置相机和机器人环境，包括校准相机内参矩阵、设置传感器偏移量以及准备目标物体的3D模型。随后，通过ROS环境启动机器人运动程序，自动采集数据并存储至指定目录。用户可根据需求调整物体姿态，生成多样化的数据集。数据集以JSON文件存储6D姿态和3D边界框信息，同时提供RGB图像、深度图像和分割掩码，便于直接用于模型训练和评估。

背景与挑战

背景概述

Realworld_dataset_capturer数据集由Chuanfang-Neptune团队开发，旨在通过UR5机器人自动生成真实世界中的物体数据集，以支持深度学习模型的训练。该数据集包含RGB图像、深度图像、分割掩码以及相机和训练物体的6D姿态信息。数据集的核心研究问题在于如何高效、精确地捕捉真实世界中的物体信息，并将其转化为可用于训练的结构化数据。该数据集在机器人视觉、物体识别和姿态估计等领域具有重要影响力，为相关研究提供了丰富的数据支持。

当前挑战

Realworld_dataset_capturer数据集在构建过程中面临多重挑战。首先，精确捕捉物体的6D姿态和3D边界框需要高精度的传感器和复杂的算法支持，这对硬件和软件的要求极高。其次，数据集的生成依赖于机器人的运动控制，如何确保机器人在移动过程中稳定捕捉高质量图像是一个技术难点。此外，数据集的多样性和泛化能力依赖于实验环境的设置和物体姿态的多样性，这对实验设计和数据采集的灵活性提出了更高要求。最后，数据集的标注和存储结构需要高效且易于扩展，以满足不同研究需求。

常用场景

经典使用场景

Realworld_dataset_capturer数据集在机器人视觉和深度学习领域具有广泛的应用。其经典使用场景包括通过UR5机器人臂和Intel D435传感器自动采集真实世界中的物体RGB图像、深度图像、分割掩码以及6D姿态数据。这些数据为训练深度学习模型提供了丰富的多模态信息，尤其在物体识别、姿态估计和场景理解等任务中表现出色。

衍生相关工作

基于Realworld_dataset_capturer数据集，许多经典研究工作得以展开。例如，研究人员利用该数据集开发了高效的6D姿态估计算法，并在机器人抓取任务中取得了显著进展。此外，该数据集还催生了多模态深度学习模型的研究，结合RGB图像、深度图像和分割掩码，提升了复杂场景下的物体识别与定位精度。

数据集最近研究