OpenWhistle-1.0-CNN

Hugging Face2026-04-20 更新2026-04-21 收录

下载链接：

https://huggingface.co/datasets/dolphinteam/OpenWhistle-1.0-CNN

下载链接

链接失效反馈

官方服务：

资源简介：

DolphinWhistle CNN 数据集是一个用于海豚哨声检测的音频分类数据集，专门设计用于训练卷积神经网络。数据集包含训练集、验证集和测试集，其中训练集和验证集来自非2019/2020年的数据池，测试集则手动从2019-2020年的完整分类配置中构建。数据集特征包括音频、声谱图、标签、文件名、录音信息、起始时间和结束时间。具体数据规模为：训练集53,828行，验证集5,980行，测试集16,708行，总计76,516行数据。统计信息显示每个分割都包含相等数量的正样本（哨声）和噪声样本，覆盖了总计8.5小时的音频窗口时间。该数据集适用于生物声学研究、海洋哺乳动物行为分析和音频分类任务。

创建时间：

2026-04-06

原始信息汇总

DolphinWhistle CNN 数据集概述

数据集基本信息

数据集名称: DolphinWhistle CNN Dataset
许可协议: MIT
任务类别: 音频分类
标签: dolphin, bioacoustics, whistle-detection, audio, spectrogram

数据集描述

该数据集是用于哨声CNN训练的最终会话不相交音频数据集。训练/验证分割来自非2019/2020年的数据池，测试分割是手动从完整的“all”配置分类数据中构建的2019-2020年数据。

数据来源与特征

本地数据集路径: cnn_dataset/datasets/cnn_trainval_manual_test_audio_v3
数据分割: train, validation, test
特征列: audio, spectrogram, label, file_name, recording, onset, offset

数据分割统计

行数统计

训练集: 53828 行
验证集: 5980 行
测试集: 16708 行

详细构建摘要

训练验证集目录: cnn_dataset/datasets/no_2019_2020_with_session_noise_split_audio
测试集目录: cnn_dataset/datasets/classification_test_with_session_noise_audio_v3

训练集

行数: 53828
正样本: 26914
噪声样本: 26914
会话数: 195
窗口小时数: 5.980885373055554

验证集

行数: 5980
正样本: 2990
噪声样本: 2990
会话数: 26
窗口小时数: 0.664445029166663

测试集

行数: 16708
正样本: 8354
噪声样本: 8354
会话数: 261
窗口小时数: 1.8564444458333356

总体统计

总行数: 76516
总窗口小时数: 8.501774848055552

搜集汇总

数据集介绍

构建方式

在海洋生物声学研究中，海豚哨声的自动检测是理解其通信行为的关键。OpenWhistle-1.0-CNN数据集的构建采用了会话分离策略，确保训练、验证与测试集之间不存在数据泄露。训练与验证数据源自非2019至2020年期间的录音池，而测试集则专门从2019至2020年的完整分类配置中手动划分，涵盖了不同会话和噪声样本，以模拟真实场景的多样性。该过程通过精确的音频片段标注，包括起始时间、偏移时间及对应标签，形成了结构化的音频与频谱图数据，为模型训练提供了可靠基础。

特点

该数据集专为哨声检测的卷积神经网络设计，其核心特征在于平衡的正负样本分布，每个分割中哨声与噪声样本数量均等，增强了分类任务的鲁棒性。数据涵盖大量独立会话，总计超过8.5小时的音频窗口，确保了时间与场景的广泛覆盖。特征维度包括原始音频、频谱图、文件名称及时间标注，支持多模态分析。测试集独立于训练数据，基于特定年份构建，有效评估模型在未知数据上的泛化能力，为生物声学检测任务提供了高标准基准。

使用方法

使用OpenWhistle-1.0-CNN数据集时，研究人员可直接加载预分割的训练、验证与测试集，专注于音频分类模型的开发与评估。数据集以标准格式提供音频和频谱图特征，便于集成到深度学习框架中，进行端到端的哨声检测训练。通过利用标注的起始与偏移时间，可进一步分析哨声的时间模式。建议在模型训练中注意会话分离原则，避免跨分割数据污染，以确保评估结果的可靠性，推动海洋哺乳动物声学监测技术的进步。

背景与挑战

背景概述

OpenWhistle-1.0-CNN数据集聚焦于生物声学领域，特别是海豚哨声检测与分类研究。该数据集由相关研究团队于近年构建，旨在通过深度学习模型，尤其是卷积神经网络，对海豚哨声进行高效识别与分类。其核心研究问题在于解决水下声学信号中生物声特征的自动提取与判别，这对于海洋哺乳动物行为研究、生态监测及保护生物学具有重要科学价值。数据集的创建整合了多时段音频记录，采用会话分离策略以确保模型泛化能力，推动了音频分类技术在复杂自然环境中的应用。

当前挑战

该数据集面临的挑战主要体现在两个方面：在领域问题层面，海豚哨声检测需应对水下音频信号的高噪声干扰、声学特征的时空变异性以及不同海豚个体哨声的细微差异，这要求模型具备强大的特征分辨与抗干扰能力；在构建过程中，挑战包括从原始音频数据中精确标注哨声的起始与偏移时间、确保训练与测试集在会话层面的独立性以避免数据泄露，以及平衡正负样本以优化模型训练效果。这些挑战共同指向了生物声学数据标准化与深度学习模型鲁棒性的提升需求。

常用场景

经典使用场景

在海洋生物声学领域，声学监测是研究海豚行为与生态的关键手段。OpenWhistle-1.0-CNN数据集通过提供大量标注的海豚哨声与非哨声音频片段，为训练卷积神经网络模型以自动识别海豚哨声提供了核心资源。该数据集采用会话分离的划分策略，确保了训练、验证与测试集之间的独立性，从而有效评估模型在真实海洋环境中的泛化能力，推动了哨声检测技术的标准化发展。

衍生相关工作

围绕该数据集，学术界衍生了一系列经典研究工作。例如，研究人员利用其训练了深度卷积神经网络模型，实现了端到端的海豚哨声检测与分类，相关成果发表于生物声学与机器学习领域的顶级会议。这些工作进一步推动了迁移学习在跨海域哨声识别中的应用，以及多模态声学数据分析框架的开发。同时，该数据集也促进了开源声学工具包的完善，为全球海洋生物声学研究社区提供了可复现的基准模型与算法。

数据集最近研究