Underwater Acoustic Target Detection (UATD) dataset

Name: Underwater Acoustic Target Detection (UATD) dataset
Creator: 鹏城实验室
Published: 2022-12-02 09:38:51
License: 暂无描述

arXiv2022-12-02 更新2024-06-21 收录

下载链接：

https://doi.org/10.6084/m9.figshare.21331143.v3

下载链接

链接失效反馈

官方服务：

资源简介：

UATD数据集是由鹏城实验室创建，包含9200张使用Tritech Gemini 1200ik声纳捕获的图像，标注了10类水下目标物体。数据集收集自湖泊和浅水区域，旨在解决水下目标检测的挑战，特别是缺乏可用数据集和声纳图像处理的问题。UATD数据集的应用领域包括水下机器人事故救援、设施维护和生物调查等，通过提供高分辨率原始声纳图像和精确的标注，支持了水下目标检测算法的研究和开发。

The UATD Dataset was created by Peng Cheng Laboratory. It comprises 9200 images captured by the Tritech Gemini 1200ik sonar, with annotations for 10 categories of underwater target objects. The dataset was collected from lakes and shallow water regions, aiming to address the challenges in underwater target detection, particularly the scarcity of available datasets and the difficulties in sonar image processing. Its application fields include underwater robotic accident rescue, facility maintenance, biological surveys and other related scenarios. By providing high-resolution raw sonar images and precise annotations, the UATD Dataset supports the research and development of underwater target detection algorithms.

提供机构：

鹏城实验室

创建时间：

2022-12-01

搜集汇总

数据集介绍

构建方式

UATD数据集通过使用Tritech Gemini 1200ik多波束前视声呐，在中国的茂名和大连的湖泊及浅水区域进行了数据采集。该设备在720kHz和1200kHz两种频率下工作，分别用于长距离目标检测和短距离高分辨率成像。数据集包含了超过9000张高分辨率的原始声呐图像，并标注了10类目标物体，如立方体、圆柱体、轮胎等。数据采集过程中，声呐设备被固定在一个机械结构上，并通过船只进行移动，以确保在不同角度和距离下捕捉目标物体。

特点

UATD数据集的显著特点在于其高分辨率的原始声呐图像和详细的标注信息，涵盖了10类不同的目标物体。数据集不仅提供了图像的原始数据，还包括了声呐的工作参数，如范围、频率、方位角等，这些信息存储在CSV文件中，便于后续分析。此外，数据集通过OpenSLT标注工具进行标注，确保了标注的准确性和一致性，特别适用于人工智能领域的目标检测研究。

使用方法

UATD数据集适用于多种人工智能应用，特别是水下目标检测和识别任务。用户可以通过下载数据集并使用提供的标注工具OpenSLT进行进一步的标注和分析。数据集的图像和标注文件分别存储在不同的文件夹中，用户可以根据需要选择训练集和测试集进行模型训练和验证。为了评估模型的性能，数据集还提供了基于MMdetection框架的基准测试结果，用户可以参考这些结果来选择合适的模型和参数设置。

背景与挑战

背景概述

随着人工智能技术的快速发展，水下机器人技术在事故救援、设施维护和生物调查等领域展现出巨大潜力。然而，水下环境的复杂性，尤其是光在水中的散射和衰减问题，使得光学成像在水下应用中面临诸多挑战。为此，声呐技术，特别是多波束前视声呐（MFLS），因其能够在高分辨率下提供动态实时图像数据，成为水下目标检测的重要工具。然而，现有的MFLS数据集存在样本量小、类别少以及数据不公开等问题，严重制约了水下目标检测算法的发展。在此背景下，Kaibing Xie、Jian Yang和Kang Qiu等人于2022年提出了水下声学目标检测（UATD）数据集，该数据集包含超过9000张由Tritech Gemini 1200ik声呐采集的MFLS图像，涵盖10类目标对象，为水下目标检测研究提供了宝贵的资源。

当前挑战

UATD数据集的构建面临多重挑战。首先，水下数据采集成本高昂，涉及经济、人力和时间的大量投入，且操作MFLS设备和标注声呐图像需要专业知识，导致相关公开数据集稀缺。其次，声呐图像通常经过像素级处理并转换为扇形表示，以适应人类的视觉习惯，但这种处理方式在人工智能领域中存在信息丢失的问题。此外，声呐图像在不同角度和位置下呈现的目标形状变化较大，增加了标注的难度。为应对这些挑战，研究团队开发了专门的标注工具OpenSLT，并通过多重验证确保标注的准确性。尽管如此，如何在保持高精度的同时提高数据集的可用性和标注效率，仍是未来研究的重要方向。

常用场景

经典使用场景

Underwater Acoustic Target Detection (UATD) 数据集的经典使用场景主要集中在水下目标检测任务中。该数据集通过提供超过9000张多波束前视声呐（MFLS）图像，涵盖了10种不同类别的目标物体，如立方体、圆柱体、轮胎等，为水下机器人和自主水下航行器（AUV）的障碍物检测、避障以及目标识别提供了丰富的训练和测试数据。通过将这些数据应用于现有的先进检测算法，如Faster R-CNN和YOLOv3，研究人员能够验证和优化这些算法在水下环境中的性能，从而提升水下机器人在救援、设施维护和生物调查等任务中的表现。

衍生相关工作

UATD 数据集的发布激发了大量相关研究工作，特别是在水下目标检测和声呐图像处理领域。基于该数据集，研究人员提出了多种改进的目标检测模型，如基于YOLOv5的MFLS图像目标检测模型和改进的Mask R-CNN模型。此外，一些研究还探索了自监督学习方法在声呐图像表示学习中的应用，进一步提升了水下目标检测的性能。这些衍生工作不仅丰富了水下目标检测的研究内容，还为水下机器人技术的实际应用提供了新的技术支持。

数据集最近研究