five

数据堂—200,475句TN数据

收藏
魔搭社区2025-11-14 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/200475Sentences-ChineseTextNormalizationData
下载链接
链接失效反馈
官方服务:
资源简介:
本套TN数据包括200,475句原始文本,每句标注文本中的特殊符号及数字的汉字读法

This TN dataset consists of 200,475 raw text sentences, each annotated with the Chinese character readings of the special symbols and numbers present in the text.
提供机构:
maas
创建时间:
2024-05-07
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含200,475个原始句子,标注了文本中特殊符号和数字的中文发音,适用于TTS和文本规范化任务。数据来源于中文小说、文章和新闻,由DataTang拥有商业版权。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务