five

Nexdata/10.4_Hours_Chinese_Mandarin_Synthesis_Corpus_Female_Customer_Service

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/10.4_Hours_Chinese_Mandarin_Synthesis_Corpus_Female_Customer_Service
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含10.4小时的中文普通话合成语料库,由女性客户服务人员录制,声音甜美,语音覆盖均衡。数据集在专业录音室录制,包含9,286句客户服务和对话文本,音节、音素和声调平衡。数据集由20-30岁的女性使用麦克风录制,语言为普通话,包含词和拼音转录以及四级韵律边界标注。适用于语音合成研究与开发。

该数据集包含10.4小时的中文普通话合成语料库,由女性客户服务人员录制,声音甜美,语音覆盖均衡。数据集在专业录音室录制,包含9,286句客户服务和对话文本,音节、音素和声调平衡。数据集由20-30岁的女性使用麦克风录制,语言为普通话,包含词和拼音转录以及四级韵律边界标注。适用于语音合成研究与开发。
提供机构:
Nexdata
原始信息汇总

数据集概述

描述

  • 时长: 10.4小时
  • 语言: 中文普通话
  • 性别: 女性
  • 角色: 客服
  • 声音特点: 甜美
  • 发音覆盖: 平衡
  • 注释: 专业语音学家参与
  • 应用: 语音合成研究与开发

格式

  • 采样率: 48,000Hz
  • 位深: 16bit
  • 格式: 未压缩wav, 单声道

录制环境

  • 环境: 专业录音室

录制内容

  • 句子数量: 9,286句
  • 内容类型: 客服及对话文本
  • 语音平衡: 音节、音素和声调平衡

说话者

  • 性别: 女性
  • 年龄: 20-30岁
  • 声音特点: 活泼、甜美

设备

  • 录音设备: 麦克风

语言

  • 语言: 普通话

注释

  • 注释类型: 词语和拼音转录, 四级韵律边界注释

应用场景

  • 应用: 语音合成

许可证

  • 许可证: 商业许可证
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作