LibriSpeech|语音识别数据集|自然语言处理数据集
收藏
- LibriSpeech数据集首次发布,包含约1000小时的英语语音数据,主要用于语音识别研究。
- LibriSpeech数据集在多个语音识别竞赛中被广泛应用,显著提升了模型的性能。
- 研究者开始利用LibriSpeech数据集进行端到端语音识别系统的训练,取得了突破性进展。
- LibriSpeech数据集被用于开发多语言语音识别模型,扩展了其应用范围。
- 基于LibriSpeech数据集的研究成果被广泛应用于商业语音识别产品中,推动了技术的市场化。
- LibriSpeech数据集的扩展版本发布,增加了更多的语音数据和多样性,进一步提升了研究的质量。
- 1LibriSpeech: A Large-Scale Speech Corpus for ASRJohns Hopkins University · 2015年
- 2End-to-End ASR: From Supervised to Semi-Supervised Learning with Modern ArchitecturesGoogle · 2019年
- 3SpecAugment: A Simple Data Augmentation Method for Automatic Speech RecognitionGoogle · 2019年
- 4Self-Training for End-to-End Speech RecognitionMicrosoft · 2020年
- 5Improving Transformer-Based Speech Recognition Using Unsupervised Pre-TrainingFacebook AI Research · 2021年
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
FMA (Free Music Archive)
免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集
OpenDataLab 收录
糖尿病预测数据集
糖尿病相关的医学研究或者健康数据
AI_Studio 收录
China Air Quality Historical Data
该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。
www.cnemc.cn 收录