monster-monash/WhaleSounds

Name: monster-monash/WhaleSounds
Creator: monster-monash
Published: 2025-04-14 07:01:07
License: 暂无描述

Hugging Face2025-04-14 更新2025-04-26 收录

下载链接：

https://hf-mirror.com/datasets/monster-monash/WhaleSounds

下载链接

链接失效反馈

官方服务：

资源简介：

WhaleSounds数据集包含了在南极周围的水下录音，这些录音人工标注了七种不同类型的鲸鱼叫声。数据集经过处理后，提取了标注的鲸鱼叫声，并将采样频率统一为250 Hz。最终的数据集包含了105,163个单通道时间序列，每个时间序列长度为2,500，代表大约10秒的数据，分为八个类别，包括七种鲸鱼叫声和一个未识别声音类别。数据集适用于时间序列分类任务，并已经划分为分层随机交叉验证折。

The WhaleSounds dataset consists of underwater acoustic recordings around Antarctica, manually annotated for seven different types of whale calls. After processing, the dataset extracts the annotated whale calls and standardizes the sampling frequency to 250 Hz. The dataset includes 105,163 univariate time series, each of length 2,500, representing approximately 10 seconds of data centered on the labeled whale sound, divided into eight classes including seven types of whale calls and one class for unidentified sounds. The dataset is suitable for time series classification tasks and has been split into stratified random cross-validation folds.

提供机构：

monster-monash

搜集汇总

数据集介绍

构建方式

在海洋生物声学领域，WhaleSounds数据集的构建体现了严谨的科学流程。该数据集源自南极洲水域的水下声学记录，原始录音包含多种采样率（250至2,500赫兹）的混合信号。研究团队通过人工标注识别出七种鲸类叫声，并从中提取出标注片段。为确保数据一致性，所有提取出的鲸类叫声均被重采样至统一的250赫兹频率，最终形成105,163条单通道时间序列，每条序列长度为2,500个数据点，对应10秒的音频片段，并以标注的鲸声为中心进行近似对齐。

使用方法

该数据集适用于时间序列分类任务，尤其在声学模式识别领域具有应用潜力。使用者可直接加载已处理的单变量时间序列及其对应的类别标签，每条数据代表一个以鲸声为中心的10秒音频片段。鉴于数据已预先分割为分层随机交叉验证折，研究人员可便捷地采用交叉验证流程评估模型性能。建议在预处理阶段关注低频特征提取，并利用其规整的序列长度设计深度学习架构。数据遵循CC BY 4.0许可协议，允许在注明来源的前提下用于学术研究与算法开发。

背景与挑战

背景概述

海洋生物声学领域长期致力于通过水下声学信号监测与识别鲸类物种，以支持生态保护与生物多样性研究。WhaleSounds数据集由南极洲周边水域的水下录音构成，由Brian S Miller等研究人员于2020年至2021年间系统整理并公开发布，隶属于MONSTER时间序列基准项目。该数据集核心聚焦于南极须鲸声音的自动化检测与分类问题，通过人工标注七种鲸类叫声及一类未识别声音，提供了105,163条长度为2,500的单通道时间序列样本，采样频率统一为250赫兹。其高质量标注与开放获取特性显著推动了计算声学与机器学习在海洋哺乳动物监测中的应用，为开发稳健的自动检测算法奠定了关键数据基础。

当前挑战

在鲸类声音识别领域，主要挑战在于水下声学环境的复杂性，包括背景噪声干扰、同类叫声的个体差异以及多物种声音混叠等问题，这要求分类模型具备强大的特征提取与抗干扰能力。数据集构建过程中，研究人员面临原始录音采样率不一致、标注依赖专家听力识别导致主观偏差、以及从连续录音中精准提取短时鲸叫声片段等技术难题。此外，南极极端环境下的数据采集限制与声学信号的长距离衰减特性，进一步增加了数据代表性与质量控制的挑战。

常用场景

经典使用场景

在海洋生物声学领域，WhaleSounds数据集为时间序列分类研究提供了关键支撑。该数据集收录了南极水域的鲸类声音记录，包含七种鲸类叫声及未识别声音的标注，共计超过十万条单通道时间序列。研究者通常利用这些数据训练深度学习模型，如卷积神经网络或循环神经网络，以自动识别和分类鲸类声音，从而分析鲸类行为模式与种群分布。这种应用不仅提升了声学监测的自动化水平，也为海洋生态研究提供了高效工具。

解决学术问题

WhaleSounds数据集有效解决了海洋声学中鲸类声音自动检测与分类的学术难题。传统方法依赖人工听辨，效率低下且易受主观因素影响。该数据集通过标准化处理，将原始录音统一为250赫兹采样频率，并提取长度为2500点的声音片段，为机器学习算法提供了高质量输入。其意义在于推动了声学信号处理与生态学的交叉研究，促进了自动化检测器的发展，帮助科学家更准确地评估鲸类种群动态与栖息地变化，对极地生态系统保护具有深远影响。

实际应用

在实际应用中，WhaleSounds数据集被广泛用于海洋监测与保护项目。基于该数据集训练的模型可部署于水下声学传感器网络，实时识别鲸类声音，辅助船舶航行避让，减少碰撞风险。同时，这些技术应用于长期声学监测系统，帮助环保机构追踪鲸类迁徙路线，评估人类活动如航运或资源开采对海洋哺乳动物的影响。此类应用不仅提升了海洋管理的科学性，也为国际鲸类保护协议提供了数据支持。

数据集最近研究