THCHS30 中文语音数据集|语音识别数据集|中文语音数据库数据集

帕依提提2024-03-04 收录

语音识别

中文语音数据库

下载链接：

https://www.payititi.com/opendatasets/show-1258.html

下载链接

链接失效反馈

资源简介：

THCHS30是一个开放的中文语音数据库，由清华大学语音与语言技术中心（CSLT）发布。原始记录是2002年由王冬在清华大学计算机科学系智能与系统国家重点实验室朱晓燕教授的指导下进行的，原始名称为“ TCMSD”，代表“清华连续大学”。普通话语音数据库”。 13年后的出版物是由王东博士发起的，并得到了朱晓燕教授的支持。我们希望为语音识别领域的新研究人员提供一个玩具数据库。

提供机构：

帕依提提

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集，包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素，标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

COVID-19 Data Hub

COVID-19 Data Hub是一个全球性的COVID-19数据集，包含了来自多个国家和地区的疫情数据，涵盖了病例数、死亡数、康复数、测试数等信息。此外，数据集还包括了与疫情相关的经济、社会和政策数据。

covid19datahub.io 收录

Figshare

Figshare是一个在线数据共享平台，允许研究人员上传和共享各种类型的研究成果，包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

CBIS-DDSM

该数据集用于训练乳腺癌分类器或分割模型，包含3103张乳腺X光片，其中465张有多个异常。数据集分为训练集和测试集，还包括3568张裁剪的乳腺X光片和对应的掩码。

github 收录

A00_13081a.jpg

Link to OCHRE database: http://pi.lib.uchicago.edu/1001/org/ochre/a8598ac4-9093-d548-30f3-84ce2ec953a7

DataONE 收录