255doesnotexist/GreendamOpencpop
收藏Hugging Face2023-04-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/255doesnotexist/GreendamOpencpop
下载链接
链接失效反馈官方服务:
资源简介:
Opencpop是一个高质量的中文流行歌曲语料库,专为歌唱声音合成(SVS)系统设计。该数据集包含100首独特的中文歌曲,由一位专业女歌手在专业录音室环境中以44,100 Hz的采样率录制。所有歌唱录音都已进行了音素注释,包括话语/音符/音素边界和音高类型。数据集共包含3,756个话语,总时长约5.2小时。测试集由5首随机选择的歌曲组成,并提供了基线合成结果。
Opencpop是一个高质量的中文流行歌曲语料库,专为歌唱声音合成(SVS)系统设计。该数据集包含100首独特的中文歌曲,由一位专业女歌手在专业录音室环境中以44,100 Hz的采样率录制。所有歌唱录音都已进行了音素注释,包括话语/音符/音素边界和音高类型。数据集共包含3,756个话语,总时长约5.2小时。测试集由5首随机选择的歌曲组成,并提供了基线合成结果。
提供机构:
255doesnotexist
原始信息汇总
数据集概述
数据集名称
- Opencpop
数据集描述
- Opencpop 是一个公开的高质量普通话歌唱语料库,专为歌唱声音合成(SVS)系统设计。该语料库包含100首独特的普通话歌曲,由一位专业女歌手录制。所有音频文件均以44,100 Hz的采样率在专业录音室环境中录制。
数据集内容
- 所有歌唱录音均已进行语音学标注,包括话语/音符/音素边界和音高类型。
- 最终数据集包含3,756个话语,总时长约5.2小时。
- 测试集由5首随机选择的歌曲组成,并提供基线合成结果。
文件格式
- midis: MIDI文件。
- textgrids: 原始标签文件,可使用Praat或Python打开。
- wavs: 原始音频wav文件。
- segments:
- wavs: 话语级别的wav文件。
- transcriptions.txt: 话语级别标签。
- train.txt: 训练集标签。
- test.txt: 测试集标签。
标签格式
- 标签以|分隔,包括:
- 话语wav名称
- 文本
- 音素
- 音符
- 音符持续时间
- 音素持续时间
- 当前音符是否为连音,0表示否,1表示是。
许可证
- 该数据集可用于非商业目的,遵循CC BY-NC-ND 4.0许可证。
- 数据集版权归Opencpop团队所有。
- 如需商业使用,请通过电子邮件联系(zpcoftts@gmail.com)。
音节到音素映射表
- 提供了一个详细的音节到音素的映射表,用于语音合成中的音素转换。



