Nexdata/200955_Sentences_Mandarin_Prosodic_Corpus_Data
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/200955_Sentences_Mandarin_Prosodic_Corpus_Data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含200,955个经过精心选择的中文句子,这些句子来自新闻和日常对话,并进行了4种韵律层次的标注。句子长度适中,句型多样,适用于语音合成的前端韵律预测训练。数据准确性不低于99%。
该数据集包含200,955个经过精心选择的中文句子,这些句子来自新闻和日常对话,并进行了4种韵律层次的标注。句子长度适中,句型多样,适用于语音合成的前端韵律预测训练。数据准确性不低于99%。
提供机构:
Nexdata
原始信息汇总
数据集概述
描述
本数据集包含200,000条精心挑选的中文文本,涵盖新闻和口语句子,具有适当的句子长度和多样化的句子模式。数据集用于标注4个韵律层次,适用于TTS前端韵律预测训练。
规格
- 数据内容:200,955条中文句子的韵律标注
- 数据规模:200,955句
- 数据来源:新闻和人类对话
- 标注:4个韵律层次标注
- 语言:中文
- 应用场景:语音合成
- 准确性:不低于99%
许可信息
本数据集采用商业许可。



