WaveFake
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/WaveFake
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由 104,885 个生成的音频剪辑(16 位 PCM wav)组成。我们检查了在两个参考数据集上训练的多个网络。首先,LJSpeech 数据集包含 13,100 个短音频片段(平均每个 6 秒;总共大约 24 小时),由一位女性说话者朗读。它包含来自 7 部非小说类书籍的段落,音频录制在 MacBook Pro 麦克风上。其次,我们包括基于 JSUT 数据集的样本,特别是 basic5000 语料库。该语料库由 5,000 个句子组成,涵盖了日语的所有基本汉字(平均 4.8 秒;总共大约 6.7 小时)。录音是由一位以日语为母语的女性在无回声的房间里录制的。最后,我们包括来自完整文本到语音管道的样本(16,283 个短语;平均 3.8 秒;总共大约 17.5 小时)。因此,我们的数据集总共包含大约 175 小时的生成音频文件。请注意,我们不会重新分配参考数据。
提供机构:
OpenDataLab
创建时间:
2022-09-01



