Benchmark Dataset
收藏github2024-04-26 更新2024-05-31 收录
下载链接:
https://github.com/leabouffaut/BenchmarkDatasetCreator
下载链接
链接失效反馈官方服务:
资源简介:
该数据集旨在为生物声学项目提供一个标准化的数据集创建、存储、共享和使用流程,以训练和测试不同应用的AI模型。数据集包括遵循ASA标准的元数据、文件时长、采样频率、单声道通道、位深度、文件名格式和选择表字段等。
This dataset is designed to provide a standardized process for the creation, storage, sharing, and utilization of datasets for bioacoustic projects, aimed at training and testing AI models for various applications. The dataset includes metadata compliant with ASA standards, file duration, sampling frequency, mono channel, bit depth, file name format, and selection table fields.
创建时间:
2024-03-20
原始信息汇总
数据集概述
数据集创建目的
本数据集旨在创建一个标准化的生物声学数据集,用于训练和测试AI模型。目标是建立一个灵活且可重复的数据处理流程,以便于数据的创建、存储、共享和使用。
数据集标准化内容
- 元数据:遵循ASA标准。
- 文件时长:用户定义。
- 采样频率:用户定义。
- 单声道:是。
- 位深度:用户定义。
- 文件名格式:标准化。
- 选择表字段:包括开始时间、结束时间、低频、高频、开始路径、文件偏移、标签等。
标签格式
建议的标签格式为:<LatinNameAccronym>.<Location>.<CallName>
<LatinNameAccronym>:物种拉丁名的首字母组合,6个字母。<Location>:地理位置编码,4个字母。<CallName>:自由格式的声音描述。
输出内容
- 基准声音文件:根据用户输入的规格创建。
- 对应的Raven选择表:每个声音文件一个。
- 文件匹配CSV:用于Koogu等工具。
- 摘要注释CSV文件:与先前数据集匹配。
用户定义参数
用户可以通过设置以下参数来定制数据集:
- 原始项目名称
- 音频时长
- 采样频率
- 位深度
- 导出标签
- 分割导出选择
- 导出文件夹
数据集结构
数据集的输出文件夹结构如下:
Export_folder/
│
└───<Project>/
│ metadata.json
│ annotations.csv
│ audio_seltab_map.csv
│
└───audio/
│ │ <Project><OriginalFileName><OriginalSamplingFrequency><OriginalChannel><FileTimeStamp>.flac
│
└───annotations/
│ <Project><OriginalFileName><OriginalSamplingFrequency><OriginalChannel><FileTimeStamp>.txt
以上信息总结了数据集的主要特点和使用方式,旨在为用户提供一个清晰、准确的数据集概述。
搜集汇总
数据集介绍

构建方式
该数据集的构建基于已标注的生物声学数据,通过标准化流程生成。构建过程中,数据集遵循ASA标准,确保元数据、文件时长、采样频率、单声道、比特深度等参数的一致性。此外,数据集支持用户自定义标签格式,并通过Raven Pro 1.6选择表进行音频文件的标注。构建流程还包括对音频文件的重新采样和选择表的生成,确保数据集的灵活性和可重复性。
特点
该数据集的主要特点在于其标准化和灵活性。通过统一的元数据格式和音频参数,确保了数据集在不同应用场景下的兼容性。此外,数据集支持用户自定义标签格式,使得标注信息更加灵活和精确。数据集还提供了详细的文件匹配CSV和注释CSV,便于后续的模型训练和测试。
使用方法
使用该数据集时,用户可以通过Python代码或基于Streamlit的应用程序进行操作。首先,用户需创建工作文件夹并设置虚拟环境,然后下载并安装所需的Python包。通过运行Streamlit应用程序,用户可以自定义参数,如音频时长、采样频率、比特深度等,生成符合需求的基准数据集。生成的数据集包含音频文件、选择表和注释文件,便于进一步的分析和模型训练。
背景与挑战
背景概述
Benchmark Dataset是由康奈尔大学的K. Lisa Yang保护生物声学中心的研究人员Léa Bouffaut博士创建的。该数据集的创建旨在为生物声学领域提供一个标准化的数据处理流程,以便于数据的存储、共享和使用,从而支持不同应用场景下的AI模型训练与测试。通过遵循ASA标准,该数据集在元数据、文件时长、采样频率、通道类型、比特深度等方面进行了标准化处理,旨在为生物声学研究提供一个统一的基准。
当前挑战
Benchmark Dataset在构建过程中面临多项挑战。首先,如何从大量已标注的生物声学数据中提取并标准化数据,确保其灵活性和可重复性,是一个复杂的问题。其次,数据集的标准化过程中需要处理不同长度的音频文件,并在文件交接处合理处理标注信息,避免信息丢失。此外,数据集的标签格式设计也需要兼顾科学性和实用性,确保标签能够准确描述音频内容的地理和生物学特征。
常用场景
经典使用场景
Benchmark Dataset 数据集的经典使用场景主要集中在生物声学领域,尤其是在动物声音识别和分类任务中。该数据集通过标准化音频文件的元数据、采样频率、通道数等参数,为研究人员提供了一个统一的基准,以便于训练和测试各种AI模型。例如,研究人员可以使用该数据集来训练深度学习模型,以识别特定物种的叫声,或者用于环境声音监测,以检测和分类不同类型的生物声学信号。
实际应用
在实际应用中,Benchmark Dataset 数据集被广泛用于野生动物监测、生态保护和环境声音分析等领域。例如,研究人员可以利用该数据集开发自动化的声音识别系统,用于监测濒危物种的分布和行为。此外,该数据集还可以应用于城市环境中的噪声监测,帮助识别和分类不同类型的环境声音,从而为城市规划和环境保护提供科学依据。
衍生相关工作
Benchmark Dataset 数据集的发布催生了一系列相关的经典工作,特别是在生物声学和机器学习的交叉领域。例如,基于该数据集的研究人员开发了多种声音分类和识别算法,如基于深度学习的鸟类叫声识别模型。此外,该数据集还启发了其他领域的标准化工作,如环境声音数据集的标准化,进一步推动了声学数据在多个领域的应用和发展。
以上内容由遇见数据集搜集并总结生成



