蚊子声音分类数据集|生物声学数据集|分类任务数据集
收藏数据集概述
数据集描述
- 数据类型: 包含蚊子声音的音频文件和对应的标签文件。
- 文件格式:
- 音频文件:
.wav
- 标签文件:
.csv
- 音频文件:
- 下载链接: Download Dataset
数据处理
- 音频预处理:
- 过滤音频以去除噪声。
- 使用MFCC和Mel Spectrogram提取特征。
- 数据增强以提高模型的泛化能力。
分类目标
- 分类的蚊子种类:
- Aedes aegypti (登革热传播媒介)
- Anopheles stephensi (疟疾传播媒介)
- Culex pipiens (丝虫病传播媒介)
数据集用途
- 支持政府在2030年前消除疟疾和丝虫病的目标。
- 减少登革热病例,目标是将发病率降至每10万人口49例以下。

rag-datasets/rag-mini-bioasq
该数据集主要用于问答和句子相似性任务,涉及生物医学领域。数据集包含两个配置:text-corpus和question-answer-passages,分别对应不同的数据文件路径。数据集来源于BioASQ任务11b的训练数据集,并通过`generate.py`脚本生成了子集。
hugging_face 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
Natural Scene Braille Character Recognition Dataset
There are a total of 1157 Braille segment images in this dataset, including 925 in the training set and 232 in the testing set. There are two folders in the directory of this dataset: character_label and segment_label. The character_rabel file contains three formats of Braille segment images: (1) Braille segment images and label files stored in ICDAR-2015 format, each. jpg file corresponds to a. txt file, where each line stores the position and recognition label of a braille character rectangle box. The data corresponds to the coordinates of the four points in the rectangle box and the recognized numerical label; (2) The original format of the data is stored in the folder org. Each .jpg file in this folder corresponds to a .json file which marked by labelme software; (3) VOC format, stored in voc-data folder. This folder stores images and corresponding .xml files in VOC format, and marks the position of each braille character rectangle box and its corresponding numerical label information in the .xml file. In addition, the original Braille images of natural scenes and the corresponding Braille segment markings .json files are stored in the folder segment_label.
DataCite Commons 收录
CT-ORG
3D CT, 140 Cases, 6 Categories of Organ Segmentation.
github 收录