five

biodenoising-datasets

收藏
github2024-10-07 更新2024-10-14 收录
下载链接:
https://github.com/earthspecies/biodenoising-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
biodenoising-datasets是一个轻量级的Python库,用于下载和处理用于动物发声去噪的数据集。该库允许用户通过配置文件和脚本下载和验证数据集,提取发声和噪声片段。

biodenoising-datasets is a lightweight Python library for downloading and processing datasets for animal vocalization denoising. This library enables users to download and validate datasets, as well as extract vocalization and noise segments, via configuration files and scripts.
创建时间:
2024-09-13
原始信息汇总

biodenoising-datasets

概述

biodenoising-datasets 是一个轻量级的 Python 库,用于下载和处理用于动物发声去噪的数据集。通过配置文件和 run.py 脚本,用户可以下载和验证数据集,提取发声和噪声片段。

数据集来源

该数据集和库用于以下论文:

Marius Miron, Sara Keen, Jen-Yu Liu, Benjamin Hoffman, Masato Hagiwara, Olivier Pietquin, Felix Effenberger, Maddie Cusimano, "Biodenoising: animal vocalization denoising without access to clean data"

安装

创建一个环境并安装依赖项:

git clone https://github.com/biodenoising/biodenoising-datasets.git cd biodenoising-datasets pip install -r requirements.txt

使用

下载数据集

使用 run.py 脚本下载数据集并提取发声和噪声片段。例如:

python run.py --input_path /home/$USER/data/ --output_path /home/$USER/data/biodenoising16k --config cfg/config16.yml python run.py --input_path /home/$USER/data/ --output_path /home/$USER/data/ --config cfg/validation.yml --download_only

其中 --input_path 是存储数据集的本地路径,--output_path 是生成数据集的本地路径。

编写自定义配置文件

用户可以编写自己的配置文件来下载和处理数据集。配置文件是一个 YAML 文件,示例可在 cfg/config16.yml 中找到。

配置文件示例:

output: audio_timelength: 30.0 targetsr: 16000 seed: 42

macaques: download: yes path: macaques time_stretch: no add_offset: no repeat: no sample_rate: 44100 tag: clean split: train

geladas: download: yes path: geladas time_stretch: no add_offset: no repeat: no sample_rate: 44100 tag: noisy split: dev

引用

如果使用该代码进行研究,请引用:

@misc{miron2024biodenoisinganimalvocalizationdenoising, title={Biodenoising: animal vocalization denoising without access to clean data}, author={Marius Miron and Sara Keen and Jen-Yu Liu and Benjamin Hoffman and Masato Hagiwara and Olivier Pietquin and Felix Effenberger and Maddie Cusimano}, year={2024}, eprint={2410.03427}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={https://arxiv.org/abs/2410.03427}, }

待办事项

  • [ ] 为数据集编写元数据(目前仅对 anuran 实现)
  • [ ] 带有元数据的 Audioset 加载器
  • [ ] 带有元数据的 Xeno-Canto 完整数据集
  • [ ] 重构 tfrecord 生成
搜集汇总
数据集介绍
main_image_url
构建方式
在生物声学领域,biodenoising-datasets数据集的构建旨在为动物发声的去噪研究提供高质量的数据支持。通过使用Python库,该数据集能够从配置文件和run.py脚本中下载并验证数据集,进而提取动物发声和噪声片段。这一过程确保了数据的完整性和可用性,为后续的去噪算法提供了坚实的基础。
特点
biodenoising-datasets数据集的显著特点在于其专注于动物发声的去噪任务,且无需访问纯净数据。该数据集包含了多种动物的发声样本,如猕猴和狒狒,每种样本均标注了噪声和纯净标签,便于区分和处理。此外,数据集支持自定义配置文件,用户可以根据需求调整下载和处理参数,增强了数据集的灵活性和适用性。
使用方法
使用biodenoising-datasets数据集时,用户首先需通过git克隆项目并安装相关依赖。随后,利用run.py脚本下载并处理数据集,指定输入和输出路径以及配置文件。用户还可以编写自定义的配置文件,以满足特定的研究需求。数据集的输出路径根据标签和分割信息进行组织,便于后续的分析和模型训练。
背景与挑战
背景概述
生物降噪数据集(biodenoising-datasets)是由Marius Miron等研究人员于2024年创建,旨在解决动物声音降噪问题。该数据集的核心研究问题是如何在没有干净数据的情况下对动物声音进行降噪。这一研究不仅推动了生物声学领域的发展,还为保护生物多样性提供了技术支持。通过提供可下载和处理的数据集,研究者们能够更有效地进行动物声音的降噪实验,从而在生态保护和生物研究中发挥重要作用。
当前挑战
生物降噪数据集在构建过程中面临多项挑战。首先,数据集的创建需要在没有干净数据的情况下进行,这增加了数据处理的复杂性。其次,动物声音的多样性和复杂性使得数据标注和分类变得困难。此外,数据集的下载和处理过程中需要确保音频文件的完整性和准确性,这对数据管理提出了高要求。最后,如何有效地生成和使用元数据以支持数据集的进一步研究,也是一个亟待解决的问题。
常用场景
经典使用场景
在动物声学研究领域,biodenoising-datasets数据集被广泛用于动物叫声的去噪任务。通过该数据集,研究人员能够下载并处理包含动物叫声和背景噪声的音频数据,从而训练和验证去噪模型。这一过程不仅支持了基于深度学习的去噪算法的研究,还为开发无需干净数据的去噪技术提供了宝贵的资源。
解决学术问题
biodenoising-datasets数据集解决了动物声学研究中一个关键的学术问题,即在没有干净数据的情况下进行动物叫声的去噪。这一问题的解决对于保护生物多样性、监测野生动物行为以及开发新型生物声学技术具有重要意义。通过提供高质量的噪声和叫声数据,该数据集推动了相关领域的研究进展,并为未来的算法创新奠定了基础。
衍生相关工作
biodenoising-datasets数据集的发布催生了一系列相关研究工作。例如,基于该数据集的深度学习模型在多个国际会议上被展示,推动了动物声学去噪技术的进步。此外,该数据集还被用于开发新的音频处理算法,如时间拉伸和偏移添加技术,进一步丰富了动物声学研究的工具箱。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作