five

AISHELL-3 高保真中文语音数据库

收藏
超神经2024-02-27 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/29352
下载链接
链接失效反馈
官方服务:
资源简介:
希尔贝壳中文普通话语音数据库 AISHELL-3 的语音时长为 85 小时共 88035 句话,可做为多说话人合成系统。录制过程在安静室内环境中, 使用高保真麦克风(44.1kHz,16bit)。该数据集由 218 名来自中国不同口音区域的发言人参与录制。专业语音校对人员进行拼音和韵律标注,并通过严格质量检验,此数据库音字确率在 98% 以上。

The Hilbeike Mandarin Chinese Speech Database AISHELL-3 has a total duration of 85 hours and contains 88,035 utterances, which can be used for multi-speaker speech synthesis systems. Recordings were conducted in quiet indoor environments using high-fidelity microphones (44.1 kHz, 16-bit). A total of 218 speakers from different accent regions across China participated in the recording sessions. Professional speech proofreaders performed pinyin and prosodic annotation, followed by strict quality inspection. The character-pinyin accuracy of this database exceeds 98%.
创建时间:
2024-02-07
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AISHELL-3是一个高保真中文普通话语音数据库,包含85小时、88035句话的语音数据,由218名来自中国不同口音区域的发言人录制,采样率为44.1kHz、16bit,适用于多说话人合成系统。该数据集经过专业拼音和韵律标注,音字确率超过98%,可用于语音生成、音频处理等任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务