NanKai Sonar Image Dataset (NKSID)

github2024-04-11 更新2024-05-31 收录

下载链接：

https://github.com/Jorwnpay/NK-Sonar-Image-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含2617张来自8个类别的图像，标签显示自然长尾分布。数据收集发生在渤海湾，使用配备多波束前视声纳的遥控潜水器捕捉水下数据。为了减少目标间的干扰并便于定位，目标通过绳索连接到浮标，并悬挂在水面下约5-10米处。数据收集过程中，从不同视角、距离（2-15米）和频率（750kHz, 1.2MHz）捕捉每个目标的图像，以增强数据集的丰富性。

This dataset comprises 2,617 images from 8 categories, exhibiting a natural long-tail distribution in their labels. The data collection took place in the Bohai Bay, where a remotely operated vehicle equipped with a multibeam forward-looking sonar was utilized to capture underwater data. To minimize interference between targets and facilitate positioning, each target was tethered to a buoy and suspended approximately 5-10 meters below the water surface. During the data collection process, images of each target were captured from various angles, distances (2-15 meters), and frequencies (750kHz, 1.2MHz) to enhance the richness of the dataset.

创建时间：

2023-11-30

原始信息汇总

NK-Sonar-Image-Dataset (NKSID) 概述

数据集基本信息

名称: NanKai Sonar Image Dataset (NKSID)
类别数: 8
图像数量: 2617
数据收集地点: Bohai Bay ($39^circ N 118^circ E$)
数据收集工具: 配备Oculus M750d多波束前视声呐的遥控潜水器(ROV)
图像特征: 目标通过绳索附着在浮标上，悬挂在水面下约5-10米，从不同角度、距离(2-15m)和频率(750kHz, 1.2MHz)捕捉
数据处理: 目标选择、预处理和标注

数据集使用

下载与解压: 从仓库直接下载并解压所有.zip文件，每个类别的图像单独压缩
文件说明:
- train_abs.txt: 包含每个图像的相对路径和标签
- kfold_train.txt 和 kfold_val.txt: 存储十折交叉验证的随机训练集/验证集分割，$n$表示样本索引，对应train_abs.txt中的第$n$行

示例应用

示例仓库: Jorwnpay/Sonar-OLTR (github.com)，展示使用此数据集进行开放集长尾识别的示例

引用信息

论文引用: latex @article{jiao2024open, title={Open-set recognition with long-tail sonar images}, author={Jiao, Wenpei and Zhang, Jianlei and Zhang, Chunyan}, journal={Expert Systems with Applications}, pages={123495}, year={2024}, publisher={Elsevier} }

搜集汇总

数据集介绍

构建方式

在渤海湾（39°N 118°E）进行的实地数据采集过程中，研究团队采用了一台配备多波束前视声呐（Oculus M750d）的遥控潜水器（ROV），以捕捉水下目标的图像数据。为减少目标间的干扰并便于定位，目标通过绳索悬挂在浮标上，深度约为5至10米。数据采集时，从不同视角、距离（2-15米）和频率（750kHz, 1.2MHz）对目标进行拍摄，以丰富数据集的多样性。随后，经过目标筛选、预处理和标注，最终形成了包含2617张图像的八类数据集，展现了自然的长尾分布特征。

特点

NKSID数据集的显著特点在于其自然的长尾分布，这种分布反映了实际应用中常见的类别不平衡问题。此外，数据集通过多视角、多距离和多频率的采集方式，确保了图像数据的多样性和复杂性，为声呐图像识别研究提供了丰富的实验素材。每个类别的图像数量差异较大，这种不平衡性为研究者提供了在长尾分布下进行模型训练和评估的理想平台。

使用方法

用户可直接从GitHub仓库下载数据集，并解压所有.zip文件。由于单个文件大小超过GitHub上传限制，每个类别的图像被分别压缩。train_abs.txt文件包含了每张图像的相对路径和标签信息。kfold_train.txt和kfold_val.txt文件存储了十折交叉验证的训练集和验证集划分，其中数字n代表样本索引，对应于train_abs.txt文件中的第n行。此外，用户可参考[Jorwnpay/Sonar-OLTR](https://github.com/Jorwnpay/Sonar-OLTR)仓库中的示例，了解如何使用该数据集进行开放集长尾识别研究。

背景与挑战

背景概述

南开声呐图像数据集（NanKai Sonar Image Dataset, NKSID）是由南开大学团队创建的一个新型前视声呐图像识别基准数据集。该数据集于渤海湾（39°N 118°E）采集，使用配备多波束前视声呐（Oculus M750d）的遥控潜水器（ROV）进行水下数据捕获。数据集包含2617张图像，涵盖8个类别，标签呈现自然的长尾分布。NKSID的创建旨在解决水下目标识别中的复杂问题，通过多视角、多距离和多频率的图像采集，增强了数据集的多样性和实用性。该数据集的发布为水下声呐图像识别领域提供了重要的研究资源，推动了相关技术的进步。

当前挑战

NKSID在构建过程中面临多项挑战。首先，水下环境的复杂性导致数据采集难度较大，目标与背景的干扰问题尤为突出。其次，声呐图像的特性使得图像预处理和标注工作变得复杂，尤其是在处理长尾分布的数据时，如何确保分类模型的公平性和准确性是一个重要挑战。此外，由于单个文件大小限制，数据集的存储和分发也面临技术难题，需将每个类别的图像分别压缩。这些挑战不仅反映了水下声呐图像识别领域的技术瓶颈，也为未来的研究提供了方向。

常用场景

经典使用场景

南开声呐图像数据集（NKSID）在声呐图像识别领域具有广泛的应用前景。该数据集包含了2617张来自8个类别的图像，这些图像展示了自然的长尾分布特征。经典的使用场景包括但不限于声呐图像的分类、目标检测和识别任务。通过利用多波束前视声呐（Oculus M750d）采集的数据，NKSID为研究人员提供了一个丰富的数据资源，用于开发和验证声呐图像处理算法，特别是在复杂水下环境中的目标识别和分类任务。

实际应用

在实际应用中，NKSID数据集被广泛应用于水下目标识别和分类任务。例如，在海洋资源勘探、水下考古、以及军事侦察等领域，声呐图像的准确识别和分类是关键技术。NKSID通过提供多样化的声呐图像数据，帮助开发更高效、更精确的识别算法，从而提升了这些领域的实际操作效率和安全性。此外，该数据集还支持多频率和多视角的声呐图像分析，进一步增强了其在实际应用中的价值。

衍生相关工作

NKSID数据集的发布催生了一系列相关的经典工作。例如，基于该数据集的研究已经扩展到了开放集长尾识别（Open-set Long-tail Recognition）领域，相关工作在[Jorwnpay/Sonar-OLTR](https://github.com/Jorwnpay/Sonar-OLTR)中得到了展示。此外，NKSID还激发了对声呐图像处理算法的研究，包括但不限于深度学习模型的优化、数据增强技术的应用以及多模态数据融合等。这些衍生工作不仅丰富了声呐图像识别的理论体系，也为实际应用提供了强有力的技术支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集