five

sakei/Bird_audio_in_China

收藏
Hugging Face2024-01-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sakei/Bird_audio_in_China
下载链接
链接失效反馈
资源简介:
--- license: apache-2.0 --- # Dataset Card for Bird_audio_in_China > **本数据集收集了在中国境内的`401`种鸟种的叫声,作者将其用于一个简易的`TinyML`项目:《基于STM32F746实现实时鸟种识别》** > > 鸟叫声音分类作为一种常见的环境音分类任务,也非常适合用于嵌入式AI应用的探索,并且在生态研究、鸟类保护、生物多样性监测都具有重要的现实意义。通过将鸟叫声音分类算法和模型压缩到小型设备中,可以将这些功能带到更多的场景和应用中,例如将鸟叫声音分类技术应用于智能鸟窝监控系统、无人机巡航监测系统等领域,用于评估生态系统的健康状态以及监测气候变化,也可以可以对鸟类的分布情况、迁徙路径、栖息地利用等进行监测和研究。 > > **申明:声音源来自https://xeno-canto.org**,**这是一个致力于分享来自世界各地的鸟声的网站** ## 数据集描述 本数据集收集了在中国境内的`401`种鸟种的叫声,详细鸟种的列表[点击这里](./birds_list.json),格式如下: ```json { "物种的通用名称": { "sp": "物种的具体名称(绰号)", "ssp": "亚种名称(亚种加词)", "en": "物种的英文名称" } } ``` - **分享者:** [sakei](https://huggingface.co/sakei) - **协议:** Aapache-2.0 - **数据样本格式**: .wav - **大小**: 51.4 GB(55,284,289,304字节) - **包含**: 6,507个文件 - **注意,部分首字母的鸟种太多,我打包为zip格式方便储存** ## 数据示例样本 [demo1](./Tragopan.89866585.wav)

--- license: apache-2.0 --- # Dataset Card for Bird_audio_in_China > **This dataset collects the vocalizations of 401 bird species within the territory of China, and was used by the author for a simple TinyML project titled "Real-time Bird Species Recognition Based on STM32F746"** > > Bird vocalization classification, as a common environmental sound classification task, is highly suitable for exploring embedded AI applications, and holds important practical significance for ecological research, bird conservation and biodiversity monitoring. By compressing bird vocalization classification algorithms and models into small embedded devices, these functionalities can be extended to more scenarios and applications. For example, applying bird vocalization classification technology to smart bird nest monitoring systems, unmanned aerial vehicle (UAV) cruise monitoring systems and other fields can be used to assess the health status of ecosystems, monitor climate change, as well as conduct monitoring and research on bird distribution, migration routes, habitat utilization and other aspects. > > **Declaration: The audio sources are sourced from https://xeno-canto.org**, **a website dedicated to sharing bird vocalizations from around the world** ## Dataset Description This dataset collects the vocalizations of 401 bird species within the territory of China. The complete list of bird species can be accessed [click here](./birds_list.json), with the following format: json { "物种的通用名称": { "sp": "物种的具体名称(绰号)", "ssp": "亚种名称(亚种加词)", "en": "物种的英文名称" } } - **Sharer:** [sakei](https://huggingface.co/sakei) - **License:** Apache-2.0 - **Data Sample Format:** .wav - **Size:** 51.4 GB (55,284,289,304 bytes) - **Total Files:** 6,507 - **Note: Some bird species with large numbers of samples are packaged into ZIP archives for easier storage** ## Sample Data [demo1](./Tragopan.89866585.wav)
提供机构:
sakei
原始信息汇总

数据集概述

数据集名称

Bird_audio_in_China

数据集描述

本数据集收集了在中国境内的401种鸟种的叫声,适用于嵌入式AI应用的探索,如实时鸟种识别。数据集在生态研究、鸟类保护、生物多样性监测等领域具有重要意义。

数据来源

声音源来自xeno-canto.org,一个致力于分享来自世界各地的鸟声的网站。

数据集详细信息

  • 分享者: sakei
  • 协议: Apache-2.0
  • 数据样本格式: .wav
  • 大小: 51.4 GB (55,284,289,304字节)
  • 包含文件数: 6,507个文件
  • 部分鸟种文件格式: zip

数据样本格式

json { "物种的通用名称": { "sp": "物种的具体名称(绰号)", "ssp": "亚种名称(亚种加词)", "en": "物种的英文名称" } }

数据示例样本

demo1

AI搜集汇总
数据集介绍
main_image_url
构建方式
Bird_audio_in_China数据集通过采集自xeno-canto.org网站的音频资源,精心整理了中国境内401种鸟类的叫声。这些音频数据以.wav格式存储,总计包含6,507个文件,数据量达到51.4 GB。数据集构建过程中,作者特别关注了音频的质量和多样性,确保每种鸟类的叫声样本具有代表性,并按照物种的通用名称、具体名称及英文名称进行了详细分类和标注。
特点
该数据集的特点在于其广泛覆盖了中国境内的鸟类种类,提供了丰富的音频样本,适用于环境音分类任务。数据集中的每个音频文件都经过精心挑选和标注,确保了数据的准确性和可用性。此外,数据集的规模庞大,为深度学习模型的训练提供了充足的资源,特别适合用于嵌入式AI应用的开发和测试。
使用方法
Bird_audio_in_China数据集可用于多种应用场景,如生态研究、鸟类保护、生物多样性监测等。研究人员和开发者可以利用这些音频数据训练和测试鸟叫声音分类模型,进而应用于智能鸟窝监控系统、无人机巡航监测系统等实际项目中。数据集的使用方法包括下载音频文件、进行预处理、提取特征,并利用机器学习或深度学习算法进行模型训练和评估。
背景与挑战
背景概述
Bird_audio_in_China数据集由sakei于近期创建,专注于收集中国境内401种鸟类的叫声,旨在支持《基于STM32F746实现实时鸟种识别》的TinyML项目。该数据集不仅为嵌入式AI应用提供了宝贵资源,还在生态研究、鸟类保护及生物多样性监测等领域展现了其重要价值。通过将鸟叫声音分类算法应用于小型设备,如智能鸟窝监控系统和无人机巡航监测系统,该数据集有助于评估生态系统健康状态和监测气候变化,同时对鸟类分布、迁徙路径及栖息地利用的研究提供了数据支持。
当前挑战
Bird_audio_in_China数据集面临的挑战主要包括两方面:首先,在解决领域问题上,如何准确识别和分类401种鸟类的叫声,尤其是在自然环境中的复杂声景下,这对算法的鲁棒性和准确性提出了高要求。其次,在数据构建过程中,收集和处理大量高质量的鸟类叫声数据,确保数据的多样性和代表性,同时处理数据格式和存储问题,如将部分数据打包为zip格式以方便储存,这些都是构建过程中需要克服的技术难题。
常用场景
经典使用场景
在生态学和环境科学领域,Bird_audio_in_China数据集被广泛应用于鸟类声音的自动识别和分类研究。通过深度学习模型,研究人员能够利用这些音频数据训练出高效的分类器,用于识别不同鸟种的叫声,进而支持生物多样性监测和生态系统的健康评估。
衍生相关工作
基于Bird_audio_in_China数据集,研究人员开发了多种先进的鸟类声音识别算法和模型。这些工作不仅提升了鸟类声音分类的准确性和效率,还为其他环境声音分类任务提供了参考和借鉴,推动了嵌入式AI技术在生态监测领域的应用和发展。
数据集最近研究
最新研究方向
近年来,随着嵌入式人工智能技术的迅猛发展,基于鸟鸣声的实时识别系统逐渐成为生态监测和生物多样性研究的热点。sakei/Bird_audio_in_China数据集作为中国境内401种鸟类的音频集合,为这一领域的研究提供了宝贵的数据支持。研究者们正致力于将深度学习模型与微型计算设备(如STM32F746)结合,开发出能够在野外实时运行的鸟鸣识别系统。这些系统不仅能够应用于智能鸟巢监控和无人机巡航监测,还能为生态系统的健康评估和气候变化监测提供科学依据。此外,该数据集的应用还推动了鸟类迁徙路径和栖息地利用的研究,为生物多样性保护提供了新的技术手段。
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作