Overlapping Zebra Finch Dataset (OZF)
收藏arXiv2025-03-04 更新2025-03-06 收录
下载链接:
http://arxiv.org/abs/2503.02389v1
下载链接
链接失效反馈官方服务:
资源简介:
OZF数据集是由地球物种计划发布的一个专注于声音重叠现象的数据集。它包含真实的录音片段和合成的录音片段,后者用于精确控制重叠程度。数据集的实时部分由65分钟的女性斑马雀录音组成,经过三位注释者的标注,记录了每个发声的开始和结束时间。数据集中共有8504个发声事件,其中17.04%至少与其他一个发声重叠。该数据集旨在用于评估和改进生物声学中检测声音事件的方法,特别是在处理重叠声音事件方面。
The OZF dataset, released by the Earth Species Project, is a curated dataset focused on the phenomenon of acoustic sound overlap. It includes both real audio recordings and synthetic audio segments, with the synthetic segments used to precisely control the degree of overlap. The real-time portion of the dataset consists of 65 minutes of female zebra finch recordings, which were independently annotated by three annotators to record the start and end timestamps of each vocalization event. In total, the dataset contains 8,504 vocal events, 17.04% of which overlap with at least one other vocalization. This dataset is designed to evaluate and refine sound event detection methods in bioacoustics, especially for scenarios involving overlapping sound events.
提供机构:
地球物种计划
创建时间:
2025-03-04
搜集汇总
数据集介绍

构建方式
Overlapping Zebra Finch Dataset (OZF) was created to address the challenges of detecting overlapping bioacoustic sound events. The dataset consists of recordings of zebra finches annotated with temporally-strong labels, showcasing frequent overlaps. The real-world portion comprises 65 minutes of live recordings from eight female zebra finches interacting in a laboratory environment. The synthetic portion was generated by combining denoised female zebra finch vocalizations to controlled background tracks, allowing for a precise control of the overlap-to-vocalization ratio. This dataset is designed to evaluate the performance of detection methods in scenarios with overlapping vocalizations.
使用方法
The Overlapping Zebra Finch Dataset (OZF) can be utilized by researchers and developers to train and test sound event detection models. The dataset is divided into training, validation, and test sets, facilitating the evaluation of model performance. Users can leverage the temporally-strong annotations to train models that accurately predict the onset and offset of vocalizations. The synthetic portion of the dataset enables the study of the model's ability to handle varying degrees of overlap. OZF provides a valuable resource for advancing the field of bioacoustics and improving the detection of overlapping sound events.
背景与挑战
背景概述
在生物声学研究中,动物声音的检测是理解动物交流和行为的基础。然而,动物声音的检测面临着多种挑战,特别是在重叠声音事件的处理上。Overlapping Zebra Finch Dataset (OZF) 是一个专门针对重叠声音事件检测而设计的数据集,由 Earth Species Project、University of Edinburgh 和 McGill University 的研究人员创建。该数据集包含雌性斑马雀的录音,这些录音经过人工标注,并展示了频繁的重叠现象。OZF 数据集的创建旨在解决生物声学研究中重叠声音事件的检测问题,这对于物种识别、种群估计等研究至关重要。OZF 数据集的发布对于推动生物声学领域的发展具有重要意义。
当前挑战
OZF 数据集的构建面临着两个主要挑战。首先,如何准确地检测重叠声音事件。传统的基于帧的多标签方法无法有效地处理重叠事件。其次,如何构建一个包含重叠声音事件的生物声学数据集。OZF 数据集通过人工标注和合成数据的方式,成功地解决了这两个挑战。OZF 数据集的发布为生物声学领域的研究人员提供了一个有价值的资源,有助于推动重叠声音事件检测技术的发展。
常用场景
经典使用场景
在生物声学研究领域,准确检测生物声学声音事件对于物种识别、种群估计以及生态和保育研究至关重要。然而,传统的基于帧的方法在处理重叠事件时表现不佳。为了解决这一问题,OZF数据集被设计用来测试Voxaboxen模型,该模型利用预训练的SSL音频编码器,采用基于起始时间的检测方法,能够准确预测声音事件的起始时间和持续时间,从而区分重叠的声音事件。
解决学术问题
OZF数据集解决了传统生物声学研究中检测重叠声音事件的难题。通过使用Voxaboxen模型,该数据集能够在复杂的音频环境中准确识别和定位重叠的声音事件,这对于理解动物间的交流系统和行为模式至关重要。此外,OZF数据集还展示了Voxaboxen模型在处理高重叠比例声音事件时的鲁棒性,为生物声学领域的研究提供了新的可能性。
实际应用
OZF数据集在实际应用中具有广泛的前景。在生态学和保育领域,OZF数据集可以帮助研究人员更好地理解动物种群动态和行为模式,从而制定更有效的保护策略。此外,在动物行为学研究领域,OZF数据集可以帮助研究人员准确分析动物间的交流行为,为研究动物的社会结构和行为机制提供新的视角。
数据集最近研究
最新研究方向
该数据集的最新研究方向主要集中在生物声学声音事件的鲁棒检测上,尤其是对于重叠事件的检测。Voxaboxen模型通过利用自监督学习的音频编码器,实现了对重叠声音事件的精确检测,从而推动了声音事件检测(SED)领域的研究。该模型在多个数据集上的测试结果表明,它在处理重叠声音事件方面具有显著优势,尤其在重叠率高的情况下仍能保持高精度。此外,该研究还提出了一个新的数据集OZF,专门用于评估重叠声音事件的检测性能,为相关研究提供了宝贵的资源。
相关研究论文
- 1Robust detection of overlapping bioacoustic sound events地球物种计划 · 2025年
以上内容由遇见数据集搜集并总结生成



