five

Nexdata/20_People_Chinese_Mandarin_Multi_emotional_Synthesis_Corpus

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/20_People_Chinese_Mandarin_Multi_emotional_Synthesis_Corpus
下载链接
链接失效反馈
官方服务:
资源简介:
20人中文普通话多情感合成语料库。该数据集由20名不同年龄和性别的中国母语者录制,涵盖了七种情感(快乐、愤怒、悲伤、惊讶、恐惧、厌恶、中性)。文本内容来自小说,音节、音素和声调均经过平衡处理。专业语音学家参与了标注工作,确保数据精确匹配语音合成的研究和开发需求。数据格式为48,000Hz、24bit、未压缩的wav文件,单声道。录制环境为专业录音室,设备为麦克风。数据量每人140分钟,每种情感20分钟。应用场景主要为语音合成。

20人中文普通话多情感合成语料库。该数据集由20名不同年龄和性别的中国母语者录制,涵盖了七种情感(快乐、愤怒、悲伤、惊讶、恐惧、厌恶、中性)。文本内容来自小说,音节、音素和声调均经过平衡处理。专业语音学家参与了标注工作,确保数据精确匹配语音合成的研究和开发需求。数据格式为48,000Hz、24bit、未压缩的wav文件,单声道。录制环境为专业录音室,设备为麦克风。数据量每人140分钟,每种情感20分钟。应用场景主要为语音合成。
提供机构:
Nexdata
原始信息汇总

数据集描述

20 People - Chinese Mandarin Multi-emotional Synthesis Corpus。由汉语母语者录制,涵盖不同年龄和性别。包含七种情感文本,均来自小说,音节、音素和声调平衡。专业语音学家参与标注。精确匹配语音合成研发需求。

格式

48,000Hz, 24bit, 未压缩的wav格式,单声道

录制环境

专业录音室

录制内容

七种情感(快乐、愤怒、悲伤、惊讶、恐惧、厌恶、中性);文本均来自小说

发音人

20人,不同年龄组和性别

设备

麦克风

语言

普通话

标注

词语和拼音转录,韵律边界标注

应用场景

语音合成

数据量

每人数据量为140分钟,每种情感20分钟

许可信息

商业许可

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作