yangwang825/audioset|音频分类数据集|音频事件识别数据集
收藏AudioSet 数据集概述
数据集配置
AudioSet 数据集包含多个配置,每个配置对应不同的数据文件和分割:
-
audioset500k:
- 训练集:
audioset500k.json
- 训练集:
-
balanced_train:
- 训练集:
balanced_train.json
- 训练集:
-
eval:
- 测试集:
eval.json
- 测试集:
-
unbalanced_train_part00 至 unbalanced_train_part40:
- 每个部分对应一个 JSON 文件,例如
unbalanced_train_part00.json
至unbalanced_train_part40.json
- 每个部分对应一个 JSON 文件,例如
数据集描述
AudioSet 包含 527 个音频事件类别的扩展本体和从 YouTube 抽取的 200 万个 10 秒长的人工标注声音片段。部分片段在 YouTube 上缺失,因此下载的文件数量会有所不同。
该数据集包括:
- 平衡训练集的 20550 / 22160 个文件
- 不平衡训练集的 1913637 / 2041789 个文件(分为 41 个部分)
- 评估集的 18887 / 20371 个文件
为了提高训练效率,增加了稍微更平衡的子集 AudioSet500K。
参考文献
- Gemmeke, Jort F., et al., Audio set: An ontology and human-labeled dataset for audio events, 2017
- Kong, Qiuqiang, et al., Panns: Large-scale pretrained audio neural networks for audio pattern recognition, 2020
- Nagrani, Arsha, et al., Attention bottlenecks for multimodal fusion, 2021

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
ECNU-SEA/SEA_data
该数据集包含四种类型的文件:原始PDF格式的论文、通过Nougat解析后的mmd文件、爬取的原始评审文本以及处理后的评审JSON文件。数据集来源于OpenReview,包括NeurIPS-2023和ICLR-2024的最新论文及其评审。
hugging_face 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
PRAMS
Jamie Daw, jrd2199@cumc.columbia.edu
DataCite Commons 收录
ERIC (Education Resources Information Center)
ERIC (Education Resources Information Center) 是一个广泛的教育文献数据库,包含超过130万条记录,涵盖从1966年至今的教育研究、政策和实践。数据集内容包括教育相关的期刊文章、书籍、研究报告、会议论文、技术报告、政策文件等。
eric.ed.gov 收录