InsectSet459
收藏arXiv2025-03-19 更新2025-03-21 收录
下载链接:
https://doi.org/10.5281/zenodo.14056457
下载链接
链接失效反馈官方服务:
资源简介:
InsectSet459是一个包含459种直翅目和蝉科昆虫声音的开源数据集,由德国马克斯·普朗克动物行为研究所等机构制作。该数据集包含26399个音频文件,涵盖了从低频到超高频的广泛频率范围,适用于开发新型深度学习方法的训练。数据集通过从xeno-canto和iNaturalist公共数据集中精心筛选和预处理而成,可用于昆虫声音的自动检测和分类,有助于监测昆虫种群变化。
InsectSet459 is an open-source dataset containing the sounds of 459 species of Orthoptera and Cicadidae insects, developed by institutions including the Max Planck Institute for Animal Behavior in Germany. This dataset comprises 26,399 audio files, covering a wide frequency range from low to ultra-high frequencies, and is suitable for training novel deep learning models. The dataset was carefully screened and preprocessed from the public datasets xeno-canto and iNaturalist. It can be used for automatic detection and classification of insect sounds, and facilitates the monitoring of insect population changes.
提供机构:
德国马克斯·普朗克动物行为研究所, 荷兰自然生物多样性中心, 荷兰蒂尔堡大学
创建时间:
2025-03-19
搜集汇总
数据集介绍

构建方式
InsectSet459数据集的构建基于多个开放数据源,包括xeno-canto、iNaturalist和BioAcoustica。研究人员从这些平台下载了物种级别的音频文件,并进行了严格的去重和筛选。所有文件均经过标准化处理,转换为WAV或MP3格式,并保留了原始采样率以确保音频信息的完整性。数据集中的每个音频文件被修剪为最长2分钟的片段,以增加音频多样性并避免过长的文件影响训练效果。最终,数据集包含了26399个音频文件,涵盖了459种昆虫物种。
特点
InsectSet459数据集的一个显著特点是其广泛的物种覆盖和地理多样性,涵盖了459种直翅目和蝉科昆虫。数据集中的音频文件采样率从8 kHz到500 kHz不等,保留了昆虫声音的广泛频率范围,尤其是超声波部分。此外,数据集中的音频文件时长从几秒到几分钟不等,经过修剪后,每个文件最长不超过2分钟。这种设计使得数据集能够更好地模拟真实环境中的被动声学监测场景,并为深度学习模型提供了丰富的训练数据。
使用方法
InsectSet459数据集的使用方法主要围绕深度学习模型的训练和评估展开。数据集被划分为训练集、验证集和测试集,比例为60/20/20,确保每个物种在三个子集中都有均衡的分布。研究人员提供了基于Mel频谱图的深度学习分类器基准测试结果,包括卷积神经网络(CNN)和Transformer模型。用户可以使用该数据集开发新的音频表示方法,尤其是针对高频率和可变采样率的昆虫声音识别。此外,数据集还可用于预训练模型,并在特定地理区域或任务上进行微调,以提高分类器的性能。
背景与挑战
背景概述
InsectSet459是由Marius Faiß、Burooj Ghani和Dan Stowell等研究人员于2024年发布的一个开放数据集,旨在推动昆虫声音的自动识别研究。该数据集包含来自459种直翅目和蝉科昆虫的26399个音频文件,涵盖了广泛的频率范围和采样率。InsectSet459的创建背景源于全球昆虫种群下降的严峻现实,尤其是对昆虫生物多样性和种群变化的监测需求日益迫切。通过自动化的声音识别技术,研究人员可以更高效地监测昆虫种群的变化、分布以及稀有物种的出现。该数据集的发布为开发新型深度学习算法提供了重要的基础,尤其是在处理高度可变的频率和采样率方面,展现了其在生物声学领域的广泛应用潜力。
当前挑战
InsectSet459在构建和应用过程中面临多重挑战。首先,昆虫声音的自动识别本身具有极高的复杂性,尤其是昆虫声音的频率范围广泛,部分物种的声音甚至超出了人类的听觉范围,这对深度学习模型的频率处理能力提出了极高的要求。其次,数据集的构建过程中,研究人员需要处理来自不同来源的音频文件,这些文件的采样率、格式和时长差异较大,导致数据预处理和标准化工作异常复杂。此外,数据集中存在显著的类别不平衡问题,部分物种的音频样本数量较少,这可能导致模型在训练过程中对稀有物种的识别性能较差。最后,尽管数据集覆盖了459种昆虫,但地理分布主要集中在欧洲和北美,热带地区的昆虫声音样本相对匮乏,这限制了数据集在全球范围内的适用性。
常用场景
经典使用场景
InsectSet459数据集在生物声学领域的主要应用场景是昆虫声音的自动识别与分类。该数据集包含了来自459种直翅目和蝉科的26399个音频文件,涵盖了广泛的频率范围和采样率,适用于开发基于深度学习的昆虫声音识别模型。通过该数据集,研究人员可以训练和测试模型,以自动识别不同昆虫物种的声音,从而为生物多样性监测提供技术支持。
实际应用
在实际应用中,InsectSet459数据集可以用于自动监测昆虫种群的变化和分布。通过部署基于该数据集训练的模型,研究人员可以在野外环境中自动记录和分析昆虫声音,从而实时监测昆虫种群的变化。这种技术特别适用于生态保护和农业领域,帮助识别害虫或濒危物种,并为生态系统的健康评估提供数据支持。
衍生相关工作
InsectSet459数据集衍生了一系列相关研究工作,特别是在昆虫声音识别和生物声学领域。基于该数据集,研究人员开发了多种深度学习模型,如InsectEffNet和PaSST,用于昆虫声音的分类。此外,该数据集还推动了多采样率模型的研究,探索了如何利用不同频率范围的声学信息来提高识别精度。这些工作为未来的昆虫声音识别和生态监测提供了重要的技术基础。
以上内容由遇见数据集搜集并总结生成



