RyanSpeech
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/RyanSpeech
下载链接
链接失效反馈官方服务:
资源简介:
RyanSpeech是用于研究自动文本到语音 (TTS) 系统的新型语音语料库。公开可用的TTS语料库通常嘈杂,由多个扬声器录制,或者没有高质量的男性语音数据。为了满足语音识别领域对高质量,可公开使用的男性语音语料库的需求,我们设计并创建了RyanSpeech。我们从现实世界的对话环境中获得了RyanSpeech的文本材料,这些材料包含以44.1 kHz录制的专业男性配音演员的语音超过10小时。此语料库创建的设计和流水线都使RyanSpeech成为在实际应用中开发TTS系统的理想选择。为了为未来的研究,协议和基准提供基线,我们在RyanSpeech上训练了4种最先进的语音模型和声码器。结果显示,在我们的最佳模型中,平均意见得分 (MOS) 3.36。我们已将训练有素的模型公开供下载。
提供机构:
OpenDataLab
创建时间:
2023-10-11



