biodenoising-datasets
收藏biodenoising-datasets
概述
biodenoising-datasets 是一个轻量级的 Python 库,用于下载和处理用于动物发声去噪的数据集。通过配置文件和 run.py 脚本,用户可以下载和验证数据集,提取发声和噪声片段。
数据集来源
该数据集和库用于以下论文:
Marius Miron, Sara Keen, Jen-Yu Liu, Benjamin Hoffman, Masato Hagiwara, Olivier Pietquin, Felix Effenberger, Maddie Cusimano, "Biodenoising: animal vocalization denoising without access to clean data"
安装
创建一个环境并安装依赖项:
git clone https://github.com/biodenoising/biodenoising-datasets.git cd biodenoising-datasets pip install -r requirements.txt
使用
下载数据集
使用 run.py 脚本下载数据集并提取发声和噪声片段。例如:
python run.py --input_path /home/$USER/data/ --output_path /home/$USER/data/biodenoising16k --config cfg/config16.yml python run.py --input_path /home/$USER/data/ --output_path /home/$USER/data/ --config cfg/validation.yml --download_only
其中 --input_path 是存储数据集的本地路径,--output_path 是生成数据集的本地路径。
编写自定义配置文件
用户可以编写自己的配置文件来下载和处理数据集。配置文件是一个 YAML 文件,示例可在 cfg/config16.yml 中找到。
配置文件示例:
output: audio_timelength: 30.0 targetsr: 16000 seed: 42
macaques: download: yes path: macaques time_stretch: no add_offset: no repeat: no sample_rate: 44100 tag: clean split: train
geladas: download: yes path: geladas time_stretch: no add_offset: no repeat: no sample_rate: 44100 tag: noisy split: dev
引用
如果使用该代码进行研究,请引用:
@misc{miron2024biodenoisinganimalvocalizationdenoising, title={Biodenoising: animal vocalization denoising without access to clean data}, author={Marius Miron and Sara Keen and Jen-Yu Liu and Benjamin Hoffman and Masato Hagiwara and Olivier Pietquin and Felix Effenberger and Maddie Cusimano}, year={2024}, eprint={2410.03427}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={https://arxiv.org/abs/2410.03427}, }
待办事项
- [ ] 为数据集编写元数据(目前仅对 anuran 实现)
- [ ] 带有元数据的 Audioset 加载器
- [ ] 带有元数据的 Xeno-Canto 完整数据集
- [ ] 重构 tfrecord 生成




