five

Xenocanto|生物声学数据集|青蛙叫声数据集

收藏
github2024-12-20 更新2024-12-21 收录
生物声学
青蛙叫声
下载链接:
https://github.com/sains-data/Klasifikasi-Suara-Katak-Menggunakan-Dua-Model-Deep-Learning-Modified-DenseNet-121-dan-DenseNet-169
下载链接
链接失效反馈
资源简介:
数据集包含来自九种不同青蛙物种的叫声录音,包括Boana cinerascens、Hyla squirella、Pelophylax lessonae、Leptodactylus mystaceus、Dendropsophus minutus、Rana temporaria、Rhinella marina、Leptodactylus fuscus和Scinax ruber。数据集由1512个样本组成,这些样本经过从MP3到WAV格式的转换,以便进一步分析。
创建时间:
2024-12-10
原始信息汇总

Klasifikasi-Suara-Katak-Menggunakan-Dua-Model-Deep-Learning-Modified-DenseNet-121-dan-DenseNet-169

🗃️ Dataset

  • 数据来源: 数据集通过数字仓库Xenocanto获取,包含来自九种不同蛙类的叫声录音。
  • 物种列表:
    • Boana cinerascens
    • Hyla squirella (Papper Treefrog)
    • Pelophylax lessonae (Pool Frog)
    • Leptodactylus mystaceus (South American White-lipped Grassfrog)
    • Dendropsophus minutus
    • Rana temporaria
    • Rhinella marina
    • Leptodactylus fuscus
    • Scinax ruber
  • 数据格式: 数据集包含1,512个样本的叫声录音,原始格式为MP3,后转换为WAV格式以进行进一步分析。

🔄 Pra-Proses Data

  • 数据分割: 音频数据经过时间分割处理,使用五分之一秒的间隔以确保后续分析的一致性。
  • 降噪处理: 使用降噪算法优化信噪比,显著提高音频质量。
  • MFCC提取: 提取13个Mel频率倒谱系数(MFCC),用于表示与人类听觉系统相对应的频率特征。

🌐 Model

  • Modified DenseNet-121: 包含121层卷积层,通过密集连接机制实现多层次信息传播,优化特征提取。
  • Modified DenseNet-169: 包含169层卷积层,通过高密度连接模式实现更复杂的音频特征提取。

🎯 Hasil

  • 模型性能: Modified DenseNet-121在蛙类叫声分类任务中表现优于Modified DenseNet-169,准确率达到68%。
  • 评估指标: 使用精度、召回率和F1分数等指标评估模型性能,进一步验证了模型的有效性。
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于Xenocanto平台,该平台提供了来自九种不同蛙类物种的鸣叫录音,包括Boana cinerascens、Hyla squirella、Pelophylax lessonae等。数据集包含1512个样本,这些样本最初以MP3格式存储,随后被转换为WAV格式以支持后续的深度分析。数据预处理阶段包括时间段的分割和噪声减少,以确保信号质量的提升。此外,通过提取Mel频率倒谱系数(MFCC),进一步提取了音频的频谱特征,最终形成了1512个标准化的MFCC表示,为后续的深度学习模型提供了高质量的输入数据。
特点
该数据集的显著特点在于其多样性和高质量的预处理。首先,数据涵盖了九种不同的蛙类物种,确保了分类任务的多样性。其次,通过MFCC的提取,数据集不仅包含了音频的时间特征,还捕捉了与人类听觉系统相对应的频率特征。此外,数据集经过严格的时间段分割和噪声减少处理,确保了每个样本的高质量,从而提高了模型训练的准确性和稳定性。
使用方法
该数据集主要用于蛙类声音的分类任务,适合于深度学习模型的训练和评估。使用者可以利用预处理后的MFCC特征作为输入,训练如Modified DenseNet-121和DenseNet-169等深度学习模型。数据集的结构化设计使得它可以轻松集成到各种机器学习框架中,如TensorFlow或PyTorch。此外,数据集的多样性和高质量特征使其不仅适用于蛙类声音的分类,还可用于探索更广泛的生物声学研究。
背景与挑战
背景概述
Xenocanto数据集由Kelompok 25团队创建,旨在通过深度学习技术对多种蛙类物种的叫声进行分类。该数据集的核心研究问题在于利用Mel-frequency Cepstral Coefficients (MFCC)提取音频特征,并通过Modified DenseNet-121和DenseNet-169模型进行分类。蛙类作为生态系统中的重要组成部分,其多样性和生态功能对维持生态平衡至关重要。然而,由于栖息地破碎化、人为污染和全球气候变化,蛙类的种群数量正面临严重威胁。通过该数据集的研究,不仅能够提高蛙类物种的识别精度,还能为生态监测和保护提供有力支持。
当前挑战
Xenocanto数据集在构建过程中面临多项挑战。首先,蛙类叫声的多样性和复杂性使得特征提取和分类任务变得极具挑战性。其次,数据集的构建涉及从MP3格式到WAV格式的转换,以及噪声消除和数据分割等预处理步骤,这些步骤需要精确的算法和技术支持。此外,蛙类叫声的分类任务在实际应用中可能面临环境噪声干扰和数据不平衡等问题,这要求模型具备较强的鲁棒性和泛化能力。未来研究还需进一步扩展数据集的多样性和规模,以提升模型的性能和应用范围。
常用场景
经典使用场景
Xenocanto数据集的经典使用场景主要集中在生物声学领域,特别是用于分类和识别不同蛙类的声音。通过提取Mel频率倒谱系数(MFCC)并结合深度学习模型如Modified DenseNet-121和DenseNet-169,研究者能够高效地从复杂的环境声音中识别出特定蛙类的叫声。这种技术不仅提高了分类的准确性,还为生态监测提供了强有力的工具。
实际应用
在实际应用中,Xenocanto数据集被广泛用于生态监测和生物多样性评估。例如,通过分析不同蛙类的叫声,研究人员可以评估特定区域的生态健康状况,监测蛙类种群的变化,以及识别潜在的生态威胁。此外,该数据集还可用于开发智能音频监测系统,帮助环保组织和研究人员实时监控和保护濒危物种。
衍生相关工作
基于Xenocanto数据集的研究已衍生出多项相关工作,包括改进的深度学习模型和更高效的特征提取方法。例如,研究者们开发了Modified DenseNet-121和DenseNet-169模型,以提高蛙类声音分类的准确性。此外,还有研究探索了更先进的音频特征提取技术,如深度卷积神经网络(CNN)和循环神经网络(RNN),以进一步提升分类性能。这些衍生工作不仅推动了生物声学领域的发展,也为其他音频分类任务提供了新的思路和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

1963-2015年中国主要木本植物春季物候(展叶和开花始期)格网数据产品(V1)

中国物候观测网1963–2015年白蜡、垂柳、刺槐、合欢、桑树、榆树、杏树、紫荆、紫丁香和加拿大杨10种木本植物的展叶始期和开花始期格网数据,时间分辨率为逐年,空间分辨率为0.5°×0.5°。数据集组成包括:(1)数据头文件,内含物种物候期和分布范围格网的头文件信息;(2)物种物候期,内含每个物种展叶始期和开花始期1963–2015年的逐年文件;(3)物种分布范围,内含每个物种的实际分布范围格网。

地球大数据科学工程 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

1963-2016年中国地面物候观测数据集

中国物候观测网记录的物候数据,包含24个站点

地球大数据科学工程 收录