five

Xenocanto

收藏
github2024-12-20 更新2024-12-21 收录
下载链接:
https://github.com/sains-data/Klasifikasi-Suara-Katak-Menggunakan-Dua-Model-Deep-Learning-Modified-DenseNet-121-dan-DenseNet-169
下载链接
链接失效反馈
官方服务:
资源简介:
数据集包含来自九种不同青蛙物种的叫声录音,包括Boana cinerascens、Hyla squirella、Pelophylax lessonae、Leptodactylus mystaceus、Dendropsophus minutus、Rana temporaria、Rhinella marina、Leptodactylus fuscus和Scinax ruber。数据集由1512个样本组成,这些样本经过从MP3到WAV格式的转换,以便进一步分析。

本数据集收录了9个蛙类物种的鸣声录音,涵盖Boana cinerascens、Hyla squirella、Pelophylax lessonae、Leptodactylus mystaceus、Dendropsophus minutus、Rana temporaria、Rhinella marina、Leptodactylus fuscus及Scinax ruber共9个物种。数据集共计1512条样本,所有样本均已完成从MP3格式到WAV格式的转换,以适配后续分析工作。
创建时间:
2024-12-10
原始信息汇总

Klasifikasi-Suara-Katak-Menggunakan-Dua-Model-Deep-Learning-Modified-DenseNet-121-dan-DenseNet-169

🗃️ Dataset

  • 数据来源: 数据集通过数字仓库Xenocanto获取,包含来自九种不同蛙类的叫声录音。
  • 物种列表:
    • Boana cinerascens
    • Hyla squirella (Papper Treefrog)
    • Pelophylax lessonae (Pool Frog)
    • Leptodactylus mystaceus (South American White-lipped Grassfrog)
    • Dendropsophus minutus
    • Rana temporaria
    • Rhinella marina
    • Leptodactylus fuscus
    • Scinax ruber
  • 数据格式: 数据集包含1,512个样本的叫声录音,原始格式为MP3,后转换为WAV格式以进行进一步分析。

🔄 Pra-Proses Data

  • 数据分割: 音频数据经过时间分割处理,使用五分之一秒的间隔以确保后续分析的一致性。
  • 降噪处理: 使用降噪算法优化信噪比,显著提高音频质量。
  • MFCC提取: 提取13个Mel频率倒谱系数(MFCC),用于表示与人类听觉系统相对应的频率特征。

🌐 Model

  • Modified DenseNet-121: 包含121层卷积层,通过密集连接机制实现多层次信息传播,优化特征提取。
  • Modified DenseNet-169: 包含169层卷积层,通过高密度连接模式实现更复杂的音频特征提取。

🎯 Hasil

  • 模型性能: Modified DenseNet-121在蛙类叫声分类任务中表现优于Modified DenseNet-169,准确率达到68%。
  • 评估指标: 使用精度、召回率和F1分数等指标评估模型性能,进一步验证了模型的有效性。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于Xenocanto平台,该平台提供了来自九种不同蛙类物种的鸣叫录音,包括Boana cinerascens、Hyla squirella、Pelophylax lessonae等。数据集包含1512个样本,这些样本最初以MP3格式存储,随后被转换为WAV格式以支持后续的深度分析。数据预处理阶段包括时间段的分割和噪声减少,以确保信号质量的提升。此外,通过提取Mel频率倒谱系数(MFCC),进一步提取了音频的频谱特征,最终形成了1512个标准化的MFCC表示,为后续的深度学习模型提供了高质量的输入数据。
特点
该数据集的显著特点在于其多样性和高质量的预处理。首先,数据涵盖了九种不同的蛙类物种,确保了分类任务的多样性。其次,通过MFCC的提取,数据集不仅包含了音频的时间特征,还捕捉了与人类听觉系统相对应的频率特征。此外,数据集经过严格的时间段分割和噪声减少处理,确保了每个样本的高质量,从而提高了模型训练的准确性和稳定性。
使用方法
该数据集主要用于蛙类声音的分类任务,适合于深度学习模型的训练和评估。使用者可以利用预处理后的MFCC特征作为输入,训练如Modified DenseNet-121和DenseNet-169等深度学习模型。数据集的结构化设计使得它可以轻松集成到各种机器学习框架中,如TensorFlow或PyTorch。此外,数据集的多样性和高质量特征使其不仅适用于蛙类声音的分类,还可用于探索更广泛的生物声学研究。
背景与挑战
背景概述
Xenocanto数据集由Kelompok 25团队创建,旨在通过深度学习技术对多种蛙类物种的叫声进行分类。该数据集的核心研究问题在于利用Mel-frequency Cepstral Coefficients (MFCC)提取音频特征,并通过Modified DenseNet-121和DenseNet-169模型进行分类。蛙类作为生态系统中的重要组成部分,其多样性和生态功能对维持生态平衡至关重要。然而,由于栖息地破碎化、人为污染和全球气候变化,蛙类的种群数量正面临严重威胁。通过该数据集的研究,不仅能够提高蛙类物种的识别精度,还能为生态监测和保护提供有力支持。
当前挑战
Xenocanto数据集在构建过程中面临多项挑战。首先,蛙类叫声的多样性和复杂性使得特征提取和分类任务变得极具挑战性。其次,数据集的构建涉及从MP3格式到WAV格式的转换,以及噪声消除和数据分割等预处理步骤,这些步骤需要精确的算法和技术支持。此外,蛙类叫声的分类任务在实际应用中可能面临环境噪声干扰和数据不平衡等问题,这要求模型具备较强的鲁棒性和泛化能力。未来研究还需进一步扩展数据集的多样性和规模,以提升模型的性能和应用范围。
常用场景
经典使用场景
Xenocanto数据集的经典使用场景主要集中在生物声学领域,特别是用于分类和识别不同蛙类的声音。通过提取Mel频率倒谱系数(MFCC)并结合深度学习模型如Modified DenseNet-121和DenseNet-169,研究者能够高效地从复杂的环境声音中识别出特定蛙类的叫声。这种技术不仅提高了分类的准确性,还为生态监测提供了强有力的工具。
实际应用
在实际应用中,Xenocanto数据集被广泛用于生态监测和生物多样性评估。例如,通过分析不同蛙类的叫声,研究人员可以评估特定区域的生态健康状况,监测蛙类种群的变化,以及识别潜在的生态威胁。此外,该数据集还可用于开发智能音频监测系统,帮助环保组织和研究人员实时监控和保护濒危物种。
衍生相关工作
基于Xenocanto数据集的研究已衍生出多项相关工作,包括改进的深度学习模型和更高效的特征提取方法。例如,研究者们开发了Modified DenseNet-121和DenseNet-169模型,以提高蛙类声音分类的准确性。此外,还有研究探索了更先进的音频特征提取技术,如深度卷积神经网络(CNN)和循环神经网络(RNN),以进一步提升分类性能。这些衍生工作不仅推动了生物声学领域的发展,也为其他音频分类任务提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作