five

255doesnotexist/GreendamOpencpop

收藏
Hugging Face2023-04-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/255doesnotexist/GreendamOpencpop
下载链接
链接失效反馈
官方服务:
资源简介:
Opencpop是一个高质量的中文流行歌曲语料库,专为歌唱声音合成(SVS)系统设计。该数据集包含100首独特的中文歌曲,由一位专业女歌手在专业录音室环境中以44,100 Hz的采样率录制。所有歌唱录音都已进行了音素注释,包括话语/音符/音素边界和音高类型。数据集共包含3,756个话语,总时长约5.2小时。测试集由5首随机选择的歌曲组成,并提供了基线合成结果。

Opencpop是一个高质量的中文流行歌曲语料库,专为歌唱声音合成(SVS)系统设计。该数据集包含100首独特的中文歌曲,由一位专业女歌手在专业录音室环境中以44,100 Hz的采样率录制。所有歌唱录音都已进行了音素注释,包括话语/音符/音素边界和音高类型。数据集共包含3,756个话语,总时长约5.2小时。测试集由5首随机选择的歌曲组成,并提供了基线合成结果。
提供机构:
255doesnotexist
原始信息汇总

数据集概述

数据集名称

  • Opencpop

数据集描述

  • Opencpop 是一个公开的高质量普通话歌唱语料库,专为歌唱声音合成(SVS)系统设计。该语料库包含100首独特的普通话歌曲,由一位专业女歌手录制。所有音频文件均以44,100 Hz的采样率在专业录音室环境中录制。

数据集内容

  • 所有歌唱录音均已进行语音学标注,包括话语/音符/音素边界和音高类型。
  • 最终数据集包含3,756个话语,总时长约5.2小时。
  • 测试集由5首随机选择的歌曲组成,并提供基线合成结果。

文件格式

  • midis: MIDI文件。
  • textgrids: 原始标签文件,可使用Praat或Python打开。
  • wavs: 原始音频wav文件。
  • segments:
    • wavs: 话语级别的wav文件。
    • transcriptions.txt: 话语级别标签。
    • train.txt: 训练集标签。
    • test.txt: 测试集标签。

标签格式

  • 标签以|分隔,包括:
    • 话语wav名称
    • 文本
    • 音素
    • 音符
    • 音符持续时间
    • 音素持续时间
    • 当前音符是否为连音,0表示否,1表示是。

许可证

  • 该数据集可用于非商业目的,遵循CC BY-NC-ND 4.0许可证。
  • 数据集版权归Opencpop团队所有。
  • 如需商业使用,请通过电子邮件联系(zpcoftts@gmail.com)。

音节到音素映射表

  • 提供了一个详细的音节到音素的映射表,用于语音合成中的音素转换。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作