诺森伯兰海豚数据集 (Northumberland Dolphin Dataset, NDD)

Name: 诺森伯兰海豚数据集 (Northumberland Dolphin Dataset, NDD)
Creator: 纽卡斯尔大学
Published: 2019-08-07 23:00:27
License: 暂无描述

arXiv2019-08-07 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/1908.02669v1

下载链接

链接失效反馈

官方服务：

资源简介：

诺森伯兰海豚数据集是由纽卡斯尔大学创建的一个多媒体数据集，专注于白嘴海豚的精细分类。该数据集包含从诺森伯兰海岸收集的多年实地工作中的水上和水下图像以及从被动声学监测（PAM）记录中提取的哨声频谱图。数据集目前包含6649张图像和2小时40分钟的音频记录，预计在2019年实地工作季节后将增长到约26000张图像和24小时音频。数据集的创建旨在通过深度学习技术，如卷积神经网络，帮助海洋生物学家减少手动分类图像所需的时间和错误率，特别是在个体识别方面。该数据集的应用领域包括海洋生态系统的监测和保护，以及通过自动化技术提高数据处理的效率。

The Northumberland Dolphin Dataset is a multimedia dataset developed by Newcastle University, focused on fine-grained classification of white-beaked dolphins. It contains above-water and underwater images collected over years of fieldwork along the Northumberland coast, as well as whistle spectrograms extracted from Passive Acoustic Monitoring (PAM) recordings. Currently, the dataset holds 6,649 images and 2 hours and 40 minutes of audio recordings, and is projected to grow to approximately 26,000 images and 24 hours of audio data following the 2019 field season. The dataset was designed to assist marine biologists in reducing the time and error rate involved in manual image classification—particularly for individual identification—via deep learning technologies such as Convolutional Neural Networks (CNNs). Its application domains include marine ecosystem monitoring and conservation, as well as enhancing data processing efficiency through automated techniques.

提供机构：

纽卡斯尔大学

创建时间：

2019-08-07

搜集汇总

数据集介绍

构建方式

诺森伯兰海豚数据集（NDD）的构建，是通过在英国诺森伯兰海岸线进行的海豚观察活动收集得到的。该数据集整合了两种不同方法——照片识别（photo-id）和被动声学监测（PAM）所获取的数据，包括水面及水下海豚图像，以及从PAM记录中提取的哨声频谱图。数据集的构建涉及对海豚个体进行长期追踪，通过多次远征收集到的图像和音频资料进行整合，旨在为构建海豚识别模型提供支持，减少人工分类所需的时间。

使用方法

使用NDD的方法主要涉及计算机视觉技术的应用，如卷积神经网络（CNN）。研究者可以利用这些技术对海豚的显著标记进行识别，通过未见过的新图像或频谱图来识别个体。系统可以提供前五的匹配建议和置信度评分，以辅助生物学家的手动识别过程，极大地减少了人工识别所需观察的个体数量。此外，通过频谱图分析，研究者还可以进行个体数量的估算，为海洋生物学研究提供重要信息。

背景与挑战

背景概述

诺森伯兰海豚数据集（NDD）是在全球海洋生态系统监测需求日益增长的背景下，由英国纽卡斯尔大学的研究团队创建的一个多媒体个体海豚数据集。该数据集旨在通过自动化识别技术，减少研究人员在分类大量图像和音频数据时所需的人力成本。NDD收集了白喙海豚的出水与水下图像，以及通过被动声学监测（PAM）记录的哨声频谱图，为构建海豚识别模型提供了基础数据，对海洋生物学的相关研究具有重要影响。

当前挑战

该数据集在构建过程中面临诸多挑战，包括出水图像中由于天气条件限制导致的可视性问题，以及水下图像因水质影响导致的能见度问题。此外，数据集中个体间的相似性给识别带来了困难，频谱图中由于水下噪音的影响，部分哨声无法清晰显示。数据的不平衡性，即不同个体样本数量的差异，也增加了识别的复杂性。这些挑战为计算机视觉和海洋生物学领域的交叉研究提供了有趣的课题。

常用场景

经典使用场景

诺森伯兰海豚数据集（NDD）的构建旨在服务于对精细粒度分类的需求，其经典使用场景在于辅助海洋生物学家对海豚个体进行快速识别。该数据集通过整合水面及水下图像，以及声谱图，为深度学习模型提供了丰富的训练素材，从而能够实现对海豚个体特征的自动检测与分类。

解决学术问题

该数据集解决了传统海豚个体识别方法中人工分类耗时巨大、易于疲劳出错的问题。通过自动化系统，不仅加快了识别速度，降低了人工成本，而且提高了识别的准确性，有助于更精确地评估海豚种群状况、行为模式及生态系统的变化。

实际应用

在实际应用中，NDD数据集可用于海洋生态监测，通过快速识别海豚个体，有助于科学家们更好地理解海豚种群的动态变化，从而为海洋保护提供科学依据。此外，该数据集的应用还能为海洋生物资源的合理利用和管理提供支持。

数据集最近研究