DF-TIMIT-Extended|语音识别数据集|说话人识别数据集
收藏
- DF-TIMIT-Extended数据集首次发表,作为对原始TIMIT数据集的扩展,旨在提供更丰富的语音数据以支持深度学习模型的训练。
- 该数据集首次应用于语音识别领域的研究,显著提升了基于深度神经网络的语音识别系统的性能。
- DF-TIMIT-Extended数据集被广泛应用于多语言语音处理研究,成为跨语言语音识别模型训练的重要资源。
- 随着深度学习技术的进一步发展,该数据集在语音情感识别和说话人识别等新兴领域得到了广泛应用。
- 1DF-TIMIT: A Database for Dysarthric Speech RecognitionUniversity of Edinburgh · 2014年
- 2Dysarthric Speech Recognition Using Deep Learning TechniquesUniversity of Surrey · 2020年
- 3A Comparative Study of Dysarthric Speech Recognition Using Different Acoustic ModelsUniversity of Sheffield · 2018年
- 4Improving Dysarthric Speech Recognition with Transfer LearningUniversity of California, Santa Cruz · 2019年
- 5Exploring the Impact of Data Augmentation on Dysarthric Speech RecognitionUniversity of Texas at Dallas · 2021年
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
UAV123
从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。
OpenDataLab 收录
ISIC 2018
ISIC 2018数据集包含2594张皮肤病变图像,用于皮肤癌检测任务。数据集分为训练集、验证集和测试集,每张图像都附有详细的元数据,包括病变类型、患者年龄、性别和解剖部位等信息。
challenge2018.isic-archive.com 收录