MUSAN|声音识别数据集|语音处理数据集
收藏
- MUSAN数据集首次发表,由David Snyder等人创建,旨在提供一个包含音乐、语音和噪声的多样化音频数据集,以支持音频处理和机器学习研究。
- MUSAN数据集首次应用于语音识别和音频分类任务,展示了其在增强模型鲁棒性方面的潜力。
- MUSAN数据集被广泛用于深度学习模型的训练和评估,特别是在噪声环境下的语音识别任务中,显著提升了模型的性能。
- MUSAN数据集的扩展版本发布,增加了更多的音频样本和类别,进一步丰富了数据集的内容和多样性。
- 1MUSAN: A Music, Speech, and Noise CorpusLanguage Technologies Institute, Carnegie Mellon University · 2015年
- 2A Study on the Impact of MUSAN Dataset on Robust Speech RecognitionUniversity of Science and Technology of China · 2020年
- 3Enhancing Speech Recognition Systems with MUSAN Dataset: A Comparative AnalysisUniversity of Cambridge · 2019年
- 4MUSAN Dataset for Audio Processing: Applications and ChallengesStanford University · 2021年
- 5Exploring the Use of MUSAN Dataset in Noise-Robust Speech ProcessingMassachusetts Institute of Technology · 2022年
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
Club Football Match Data (2000 - 2025)
该数据集提供了一个简单的入口,用于分析全球27个国家和42个联赛的足球比赛数据,包括英超、德甲和西甲等顶级联赛。数据涵盖了从2000/01赛季到2024/25赛季的最新比赛结果。数据集还包括Elo评分,每月的1号和15号对欧洲约500支最佳球队进行快照。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录