Fisher English Training Speech|语音识别数据集|语言建模数据集
收藏
- Fisher English Training Speech数据集首次发表,作为语音识别和英语学习领域的研究资源。
- 该数据集首次应用于语音识别算法的训练和评估,显著提升了英语语音识别的准确率。
- Fisher English Training Speech数据集被广泛应用于英语教学软件的开发,促进了个性化学习的发展。
- 随着技术进步,该数据集开始用于多语种语音识别系统的研究,扩展了其应用范围。
- Fisher English Training Speech数据集的更新版本发布,增加了更多样化的语音样本,提升了数据集的多样性和代表性。
- 该数据集在深度学习领域的应用取得突破,成为训练复杂语音模型的关键资源。
- Fisher English Training Speech数据集被纳入多个国际语音识别竞赛的标准数据集,进一步验证了其质量和实用性。
- 随着人工智能技术的快速发展,该数据集继续在语音识别和自然语言处理领域发挥重要作用,支持新一代智能语音系统的研发。
- 1The Fisher Corpus: A Resource for the Next Generations of Speech-to-TextLinguistic Data Consortium (LDC) · 2004年
- 2Improving Speech Recognition with the Fisher CorpusInternational Speech Communication Association (ISCA) · 2007年
- 3Exploring the Fisher Corpus for Speech Emotion RecognitionIEEE · 2015年
- 4The Fisher Corpus: A Comprehensive Resource for Conversational Speech ResearchInternational Speech Communication Association (ISCA) · 2018年
- 5Advances in Speech Recognition Using the Fisher CorpusElsevier · 2020年
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
中国近海地形数据集(渤海,黄海,东海,南海)
本数据集包含历年来通过收集和实测方法取得的中国近海水深点数据、地形图数据(ArcGIS格式),以及黄河口、莱州湾东部、辽东湾、山东南部沿海、南海部分海域的单波束、多波束水深测量数据,包括大尺度的低密度水深数据与局部高密度水深数据。
地球大数据科学工程 收录
THCHS-30
“THCHS30是由清华大学语音与语言技术中心(CSLT)发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下,由王东完成的。清华大学计算机科学系智能与系统,原名“TCMSD”,意思是“清华连续普通话语音数据库”,时隔13年出版,由王东博士发起,并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此,该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”
OpenDataLab 收录
emotions-dataset
情绪数据集是一个精心策划的文本数据集,包含131,306个文本条目,标注了13种不同的情绪,如快乐、悲伤、中性、愤怒等。该数据集旨在提升情感分类、情感分析和自然语言处理的能力,适用于构建富有同情心的聊天机器人、心理健康工具、社交媒体分析器等。数据集文件大小为7.41MB,便于在边缘设备和大型项目中使用。
huggingface 收录
