FMFCC-A
收藏arXiv2021-10-19 更新2024-06-21 收录
下载链接:
https://github.com/Amforever/FMFCC-A
下载链接
链接失效反馈官方服务:
资源简介:
FMFCC-A数据集是由中国科学院信息工程研究所信息安全国家重点实验室创建的一个挑战性普通话数据集,专注于合成语音检测。该数据集包含50,000条普通话语音,其中40,000条为合成语音,由11个普通话TTS系统和两个普通话VC系统生成,10,000条为真实语音,来自58位不同年龄和性别的说话者。数据集分为训练、开发和评估集,用于研究在未知语音合成系统或音频后处理操作下的合成普通话语音检测。该数据集旨在填补普通话合成语音检测数据集的空白,并推动相关技术的发展。
FMFCC-A dataset is a challenging Mandarin speech dataset curated by the State Key Laboratory of Information Security, Institute of Information Engineering, Chinese Academy of Sciences, focusing on synthetic speech detection. This dataset contains 50,000 Mandarin speech samples, among which 40,000 are synthetic speech generated by 11 Mandarin TTS systems and 2 Mandarin VC systems, while the remaining 10,000 are genuine speech samples from 58 speakers with diverse ages and genders. The dataset is split into training, development and evaluation subsets to support research on synthetic Mandarin speech detection under unknown speech synthesis systems or audio post-processing operations. This dataset is designed to fill the gap in existing Mandarin synthetic speech detection datasets and promote the development of related technologies.
提供机构:
中国科学院信息工程研究所信息安全国家重点实验室
创建时间:
2021-10-19
搜集汇总
数据集介绍

构建方式
为应对日益发展的文本到语音(TTS)和语音转换(VC)技术,研究人员构建了FMFCC-A数据集,该数据集包含了由11种中文TTS系统和两种中文VC系统生成的40,000个合成中文语音和从58位说话者中收集的10,000个真实中文语音。数据集分为训练集、开发集和评估集,用于研究在各种未知语音合成系统或音频后处理操作下检测合成中文语音。评估集还进行了四种音频后处理操作,包括压缩-解压缩和添加高斯噪声。
使用方法
FMFCC-A数据集可用于训练和优化合成语音检测模型,评估模型在各种未知语音合成系统或音频后处理操作下的泛化性能。数据集分为训练集、开发集和评估集,分别用于模型的训练、优化和评估。用户可以使用训练集和开发集来构建和优化自己的合成语音检测模型,并使用评估集来测试模型在不同音频后处理操作下的性能。此外,数据集还提供了两种基准方法和来自FMFCC-A的前沿性能提交的详细分析,以帮助用户更好地理解数据集的特点和挑战。
背景与挑战
背景概述
随着文本到语音(TTS)和语音转换(VC)技术的不断进步,合成语音的检测面临着巨大的挑战。为了推动针对普通话TTS和VC技术的合成语音检测模型的发展,研究人员构建了一个具有挑战性的普通话数据集,并组织了中国图像图形学会首届虚假媒体取证挑战赛的相关音频轨道。FMFCC-A数据集是目前公开可用的最大的普通话合成语音检测数据集,包含由11个普通话TTS系统和两个普通话VC系统生成的40,000个合成普通话语句,以及来自58位说话者的10,000个真实普通话语句。该数据集分为训练、开发和评估集,用于研究在各种先前未知的语音合成系统或音频后处理操作下检测合成的普通话语音。此外,研究人员还提供了两种基线方法和FMFCC-A的前三名提交者的详细分析,展示了FMFCC-A数据集的有用性和挑战性。希望FMFCC-A数据集能够填补合成语音检测领域普通话数据集的空白。
当前挑战
FMFCC-A数据集面临的挑战包括:1)所解决的领域问题是合成语音检测,特别是在各种先前未知的语音合成系统或音频后处理操作下的检测;2)构建过程中遇到的挑战包括收集足够的真实和合成普通话语句,并确保它们的质量和多样性。此外,为了使数据集更具挑战性,研究人员在评估集上进行了四种音频后处理操作,包括压缩解压缩和添加高斯噪声,以测试检测模型在面对实际场景中的音频处理时的性能。
常用场景
经典使用场景
在合成语音检测领域,FMFCC-A数据集被视为一个极具挑战性的中文数据集,它包含由11个中文TTS系统和2个中文VC系统生成的40,000个合成中文语音,以及来自58位说话者的10,000个真实中文语音。该数据集被分为训练集、开发集和评估集,用于研究在各种先前未知的语音合成系统或音频后处理操作下检测合成中文语音的方法。FMFCC-A数据集的构建旨在促进合成语音检测模型的发展,以应对中文TTS和VC技术的挑战。
解决学术问题
FMFCC-A数据集解决了合成语音检测领域中缺乏中文数据集的问题。现有的合成语音数据集大多使用英文语音,而FMFCC-A数据集则包含了大量的中文语音数据,这对于研究中文合成语音检测方法具有重要意义。此外,FMFCC-A数据集还引入了四种音频后处理操作,使得研究人员可以评估检测模型在不同音频后处理操作下的性能,从而提高模型的鲁棒性和实用性。
实际应用
FMFCC-A数据集的实际应用场景包括但不限于:1)语音识别系统中的反欺骗模块;2)信息安全领域的语音伪造检测;3)法律取证中的语音证据分析。通过使用FMFCC-A数据集进行训练和评估,可以开发出更加准确和鲁棒的合成语音检测模型,从而提高语音识别系统的安全性和可靠性,保障信息安全,维护司法公正。
数据集最近研究
最新研究方向
在语音合成技术日益成熟的背景下,如何有效区分真实语音与合成语音成为了一个重要的研究课题。FMFCC-A数据集的构建正是为了应对这一挑战,它为研究者提供了一个大规模的、包含多种语音合成系统和音频后处理操作的真实与合成语音对。该数据集不仅有助于开发能够对抗未知语音合成系统和音频后处理操作的合成语音检测模型,而且对于提升自动语音验证系统的可靠性具有重要意义。未来,FMFCC-A数据集有望推动合成语音检测领域的发展,并为构建更加安全、可靠的语音识别系统提供有力支持。
相关研究论文
- 1FMFCC-A: A Challenging Mandarin Dataset for Synthetic Speech Detection中国科学院信息工程研究所信息安全国家重点实验室 · 2021年
以上内容由遇见数据集搜集并总结生成



