Nexdata/20_People_Chinese_Mandarin_Multi_emotional_Synthesis_Corpus
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/20_People_Chinese_Mandarin_Multi_emotional_Synthesis_Corpus
下载链接
链接失效反馈官方服务:
资源简介:
20人中文普通话多情感合成语料库。该数据集由20名不同年龄和性别的中国母语者录制,涵盖了七种情感(快乐、愤怒、悲伤、惊讶、恐惧、厌恶、中性)。文本内容来自小说,音节、音素和声调均经过平衡处理。专业语音学家参与了标注工作,确保数据精确匹配语音合成的研究和开发需求。数据格式为48,000Hz、24bit、未压缩的wav文件,单声道。录制环境为专业录音室,设备为麦克风。数据量每人140分钟,每种情感20分钟。应用场景主要为语音合成。
20人中文普通话多情感合成语料库。该数据集由20名不同年龄和性别的中国母语者录制,涵盖了七种情感(快乐、愤怒、悲伤、惊讶、恐惧、厌恶、中性)。文本内容来自小说,音节、音素和声调均经过平衡处理。专业语音学家参与了标注工作,确保数据精确匹配语音合成的研究和开发需求。数据格式为48,000Hz、24bit、未压缩的wav文件,单声道。录制环境为专业录音室,设备为麦克风。数据量每人140分钟,每种情感20分钟。应用场景主要为语音合成。
提供机构:
Nexdata
原始信息汇总
数据集描述
20 People - Chinese Mandarin Multi-emotional Synthesis Corpus。由汉语母语者录制,涵盖不同年龄和性别。包含七种情感文本,均来自小说,音节、音素和声调平衡。专业语音学家参与标注。精确匹配语音合成研发需求。
格式
48,000Hz, 24bit, 未压缩的wav格式,单声道
录制环境
专业录音室
录制内容
七种情感(快乐、愤怒、悲伤、惊讶、恐惧、厌恶、中性);文本均来自小说
发音人
20人,不同年龄组和性别
设备
麦克风
语言
普通话
标注
词语和拼音转录,韵律边界标注
应用场景
语音合成
数据量
每人数据量为140分钟,每种情感20分钟
许可信息
商业许可



