five

Google Text Normalization Challenge(Google文字规范化挑战)

收藏
阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/88079
下载链接
链接失效反馈
官方服务:
资源简介:
Text-to-speech synthesis text normalization data, from Sproat & Jaitly 2016

文本到语音合成(Text-to-speech synthesis)文本归一化(text normalization)数据集,源自Sproat与Jaitly 2016年的研究
提供机构:
阿里云天池
创建时间:
2021-01-11
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是Google文字规范化挑战的数据,源自Sproat和Jaitly于2016年的研究,用于文本到语音合成中的文本规范化任务。它包含来自维基百科的书面文本与其对应的规范化口语形式对齐的数据,旨在训练RNN模型学习正确的规范化转换函数。数据通过Google Kestrel TTS系统处理生成,并划分为训练集、运行时评估集和测试集。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务