five

蚊子声音分类数据集|生物声学数据集|分类任务数据集

收藏
github2024-12-19 更新2024-12-20 收录
生物声学
分类任务
下载链接:
https://github.com/sains-data/Klasifikasi-Suara-Nyamuk-Berbasis-CNN-untuk-Inovasi-Pengendalian-Hama-dan-Penyakit
下载链接
链接失效反馈
资源简介:
该数据集包含蚊子的音频文件(.wav格式)和对应的标签文件(.csv格式),用于分类不同种类的蚊子声音。数据集中的蚊子种类包括Aedes aegypti、Anopheles stephensi和Culex pipiens。
创建时间:
2024-11-27
原始信息汇总

数据集概述

数据集描述

  • 数据类型: 包含蚊子声音的音频文件和对应的标签文件。
  • 文件格式:
    • 音频文件: .wav
    • 标签文件: .csv
  • 下载链接: Download Dataset

数据处理

  1. 音频预处理:
    • 过滤音频以去除噪声。
    • 使用MFCCMel Spectrogram提取特征。
    • 数据增强以提高模型的泛化能力。

分类目标

  • 分类的蚊子种类:
    • Aedes aegypti (登革热传播媒介)
    • Anopheles stephensi (疟疾传播媒介)
    • Culex pipiens (丝虫病传播媒介)

数据集用途

  • 支持政府在2030年前消除疟疾和丝虫病的目标。
  • 减少登革热病例,目标是将发病率降至每10万人口49例以下。
AI搜集汇总
数据集介绍
main_image_url
构建方式
蚊子声音分类数据集的构建基于对多种蚊子物种的声音进行录音和标注。数据集包含了三种主要蚊子物种的音频记录,分别是埃及伊蚊(Aedes aegypti)、斯氏按蚊(Anopheles stephensi)和尖音库蚊(Culex pipiens)。这些音频文件以.wav格式存储,并附有相应的物种标签,存储在.csv文件中。数据处理过程中,首先通过滤波技术去除音频中的噪声,随后使用梅尔频率倒谱系数(MFCC)和梅尔频谱图(Mel Spectrogram)进行特征提取。为了增强模型的泛化能力,数据集还进行了数据增强处理。
特点
该数据集的主要特点在于其专注于热带地区常见的蚊子物种,这些物种是传播登革热、疟疾和丝虫病等疾病的主要媒介。数据集的音频文件经过精心处理,去除了环境噪声,确保了特征提取的准确性。此外,数据集采用了多种特征提取方法,如MFCC和Mel Spectrogram,以捕捉蚊子声音的细微差别。数据增强技术的应用进一步提高了模型的鲁棒性,使其在不同环境条件下仍能保持较高的分类准确率。
使用方法
使用该数据集时,用户首先需要下载包含音频文件和标签的完整数据集。随后,可以通过Python环境中的Librosa库进行音频预处理和特征提取。模型训练阶段,推荐使用TensorFlow/Keras框架构建卷积神经网络(CNN),并结合数据增强技术进行训练。训练完成后,用户可以通过Streamlit框架构建交互式应用,实时分类输入的蚊子声音。此外,数据集还提供了预训练模型和训练历史记录,方便用户直接进行模型评估或进一步优化。
背景与挑战
背景概述
蚊子声音分类数据集由2024年深度学习课程的Team-1团队开发,旨在通过卷积神经网络(CNN)对蚊子翅膀振动的声音进行分类,以支持热带地区,特别是印度尼西亚的害虫和疾病控制创新。该数据集的核心研究问题是通过声音识别蚊子的种类,包括埃及伊蚊(登革热传播媒介)、斯氏按蚊(疟疾传播媒介)和尖音库蚊(丝虫病传播媒介)。该项目的研究背景与全球卫生目标紧密相关,特别是2030年消除疟疾和丝虫病的目标,以及减少登革热发病率至每10万人中少于49例的目标。
当前挑战
蚊子声音分类数据集面临的挑战主要包括:首先,音频数据的采集和预处理过程中,如何有效去除背景噪音并提取有效的特征(如MFCC和Mel Spectrogram)是一个技术难点。其次,由于不同蚊子种类的声音特征相似,模型在区分这些声音时可能面临分类准确性的挑战。此外,数据增强技术的应用虽然有助于提高模型的泛化能力,但也可能导致数据失真,影响模型的实际表现。最后,模型的实时性要求(预测时间小于1秒)对算法的效率提出了较高的要求,尤其是在资源有限的地区部署时。
常用场景
经典使用场景
蚊子声音分类数据集的经典使用场景主要集中在基于卷积神经网络(CNN)的蚊子声音自动分类系统中。该数据集通过收集和标注不同蚊子物种(如埃及伊蚊、斯氏按蚊和尖音库蚊)的音频数据,支持模型训练以实现对蚊子声音的精准分类。这一应用场景在热带地区,尤其是印度尼西亚等蚊媒疾病高发区域,具有重要的公共卫生意义。通过分析蚊子的声音特征,研究人员能够快速识别潜在的疾病传播媒介,从而为蚊媒疾病的防控提供技术支持。
实际应用
在实际应用中,蚊子声音分类数据集可广泛应用于公共卫生监测和蚊媒疾病防控领域。例如,该数据集支持开发的自动蚊子声音分类系统可以部署在蚊媒疾病高发区域,实时监测和识别蚊子的物种,从而为疾病防控提供及时的数据支持。此外,该系统还可用于智能蚊帐或蚊虫诱捕器中,通过声音识别技术自动检测和控制蚊虫数量,减少蚊媒疾病的传播风险。这些应用场景不仅提高了疾病防控的效率,还降低了人工监测的成本和复杂性。
衍生相关工作
蚊子声音分类数据集的发布催生了一系列相关的经典工作,特别是在蚊媒疾病防控和深度学习技术的结合方面。基于该数据集,研究人员开发了多种基于CNN的蚊子声音分类模型,并通过不断优化模型结构和数据增强技术,提升了分类的准确性和鲁棒性。此外,该数据集还激发了其他研究者探索基于声音的蚊子行为分析和蚊媒疾病传播动力学研究,进一步推动了蚊媒疾病防控技术的创新与发展。这些衍生工作不仅丰富了蚊媒疾病研究的方法论,还为全球公共卫生领域提供了新的技术解决方案。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

rag-datasets/rag-mini-bioasq

该数据集主要用于问答和句子相似性任务,涉及生物医学领域。数据集包含两个配置:text-corpus和question-answer-passages,分别对应不同的数据文件路径。数据集来源于BioASQ任务11b的训练数据集,并通过`generate.py`脚本生成了子集。

hugging_face 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

Natural Scene Braille Character Recognition Dataset

There are a total of 1157 Braille segment images in this dataset, including 925 in the training set and 232 in the testing set. There are two folders in the directory of this dataset: character_label and segment_label. The character_rabel file contains three formats of Braille segment images: (1) Braille segment images and label files stored in ICDAR-2015 format, each. jpg file corresponds to a. txt file, where each line stores the position and recognition label of a braille character rectangle box. The data corresponds to the coordinates of the four points in the rectangle box and the recognized numerical label; (2) The original format of the data is stored in the folder org. Each .jpg file in this folder corresponds to a .json file which marked by labelme software; (3) VOC format, stored in voc-data folder. This folder stores images and corresponding .xml files in VOC format, and marks the position of each braille character rectangle box and its corresponding numerical label information in the .xml file. In addition, the original Braille images of natural scenes and the corresponding Braille segment markings .json files are stored in the folder segment_label.

DataCite Commons 收录

CT-ORG

3D CT, 140 Cases, 6 Categories of Organ Segmentation.

github 收录