five

Nexdata/200955_Sentences_Mandarin_Prosodic_Corpus_Data

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/200955_Sentences_Mandarin_Prosodic_Corpus_Data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含200,955个经过精心选择的中文句子,这些句子来自新闻和日常对话,并进行了4种韵律层次的标注。句子长度适中,句型多样,适用于语音合成的前端韵律预测训练。数据准确性不低于99%。

该数据集包含200,955个经过精心选择的中文句子,这些句子来自新闻和日常对话,并进行了4种韵律层次的标注。句子长度适中,句型多样,适用于语音合成的前端韵律预测训练。数据准确性不低于99%。
提供机构:
Nexdata
原始信息汇总

数据集概述

描述

本数据集包含200,000条精心挑选的中文文本,涵盖新闻和口语句子,具有适当的句子长度和多样化的句子模式。数据集用于标注4个韵律层次,适用于TTS前端韵律预测训练。

规格

  • 数据内容:200,955条中文句子的韵律标注
  • 数据规模:200,955句
  • 数据来源:新闻和人类对话
  • 标注:4个韵律层次标注
  • 语言:中文
  • 应用场景:语音合成
  • 准确性:不低于99%

许可信息

本数据集采用商业许可。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作