five

AISHELL-3

收藏
arXiv2025-09-30 收录
下载链接:
http://www.aishelltech.com/aishell_3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为AISHELL-3,包含了215,705条录音,总计281小时,由304位母语为普通话的说话者贡献(其中男性73位,女性231位)。该数据集的采样率为24kHz,并已转换为40维梅尔频谱图,其帧大小为960,帧移为240。该数据集的规模涉及304位说话者,适用于最小监督下的文本转语音(TTS)和声音转换(VC)任务。

The dataset is named AISHELL-3, which contains 215,705 audio recordings totaling 281 hours, contributed by 304 native Mandarin speakers (73 males and 231 females). The sampling rate of this dataset is 24 kHz, and the audio has been converted into 40-dimensional mel-spectrograms with a frame size of 960 and a frame shift of 240. This dataset involves 304 speakers and is suitable for text-to-speech (TTS) and voice conversion (VC) tasks under minimal supervision.
提供机构:
AISHELL
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AISHELL-3是一个大规模、高保真的开源中文普通话语音数据集,包含85小时语音、88035句,由218名不同口音区域的发言人录制,主要用于多说话人语音合成系统训练。数据集经过专业标注,音字准确率超过98%,并提供说话人属性和多级转录,支持语音合成研究与应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作