XMAD-Bench

Hugging Face2025-06-20 更新2025-06-21 收录

下载链接：

https://huggingface.co/datasets/unibuc-cs/XMAD-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

XMAD-Bench是一个大规模的跨领域多语言音频Deepfake基准数据集，包含668.8小时的真实和Deepfake语音。该数据集中的说话者、生成方法和真实音频源在训练和测试分割中是不同的，这导致了一个具有挑战性的跨领域评估设置，其中音频Deepfake检测器可以在野外进行测试。该基准表明，需要在不同的语言、说话者、生成方法和数据源之间保持强大的泛化能力的稳健音频Deepfake检测器的开发。

创建时间：

2025-06-19

搜集汇总

数据集介绍

构建方式

在音频生成技术迅猛发展的背景下，XMAD-Bench数据集通过精心设计的跨领域构建策略，为音频深度伪造检测研究提供了重要基准。该数据集整合了668.8小时的真实与伪造语音数据，其独特之处在于训练集与测试集在说话人身份、生成方法和原始音频来源三个维度上完全独立。通过采用VITS、FreeVC、KNN-VC等多种前沿语音合成与转换技术，研究团队系统性地生成了涵盖罗马尼亚语、阿拉伯语、俄语等七种语言的平行语料，并严格确保不同数据分割之间的领域差异性。

特点

作为首个跨领域多语言音频深度伪造基准，XMAD-Bench展现出鲜明的技术特征。数据集包含的语音样本在语言学特征和声学属性上具有显著多样性，覆盖从拉丁语系到斯拉夫语系等多种语言类型。其核心价值体现在模拟真实场景的评估框架，通过刻意制造训练与测试数据间的领域偏移，有效暴露现有检测模型在跨语言、跨说话人场景下的性能瓶颈。统计显示，部分先进检测器在该基准上的跨领域准确率甚至接近随机猜测水平，凸显了当前技术的局限性。

使用方法

研究者可通过官方提供的Google Drive链接获取完整数据集，压缩包内包含严格划分的训练、验证和测试集。使用配套的Python检测框架时，需预先在config.json中配置数据路径参数，随后执行主程序脚本即可复现基准实验结果。针对特定语言的深度伪造生成，项目提供了模块化的示例脚本，支持通过修改TTS模型参数（如VITS、XTTSv2等）和语音转换模块（如OpenVoice、KNN-VC等）来生成新的测试样本。这种灵活的设计允许研究者既可直接使用现有基准数据，也能扩展生成符合特定研究需求的新变体。

背景与挑战

背景概述

XMAD-Bench是由Ioan-Paul Ciobanu等研究人员于2025年提出的跨领域多语言音频深度伪造基准数据集。随着音频生成技术的快速发展，深度伪造音频在金融诈骗、身份盗用和信息误导等领域的滥用风险日益凸显。尽管现有音频深度伪造检测器在域内测试中表现出色，但其在跨域场景下的泛化能力存在显著不足。该数据集包含668.8小时的真实与伪造语音数据，通过严格区分训练集和测试集中的说话人、生成方法和音频来源，构建了具有挑战性的跨域评估框架。其创新性在于首次系统性地考察了多语言环境下检测模型对未知伪造方法的识别能力，为音频真实性认证研究提供了重要基准。

当前挑战

该数据集主要针对音频深度伪造检测领域的两大核心挑战：域间泛化能力不足和多语言适应性缺陷。实验表明现有检测器在跨域测试中性能可能降至随机猜测水平，暴露出对未知生成方法和语言特征的脆弱性。在数据构建阶段，研究人员面临真实语音源与多种伪造算法的多模态对齐难题，需平衡罗马尼亚语、阿拉伯语、俄语等七种语言的语料覆盖与数据质量。技术实现上需协调VITS、FreeVC等异构生成模型的参数配置，确保不同语种伪造样本的声学特征一致性。这些挑战使得该数据集成为检验检测算法鲁棒性的试金石。

常用场景

经典使用场景

在音频伪造检测领域，XMAD-Bench数据集通过其跨领域多语言的特性，为研究者提供了一个全面评估音频深度伪造检测模型的平台。该数据集涵盖了多种语言、不同的说话人和多种生成方法，使得模型能够在复杂的真实场景中进行测试，而不仅仅局限于同源数据的验证。这种设计使得XMAD-Bench成为评估模型泛化能力和鲁棒性的理想选择。

实际应用

XMAD-Bench数据集的实际应用场景广泛，包括金融安全、身份认证和反虚假信息传播等领域。在金融诈骗防范中，该数据集可用于训练和测试检测模型，以识别伪造的语音指令或身份验证音频。此外，在社交媒体和新闻传播中，XMAD-Bench有助于开发工具，用于检测和过滤伪造的语音内容，从而减少虚假信息的传播。

衍生相关工作

XMAD-Bench数据集已经催生了一系列关于跨领域音频伪造检测的研究工作。许多研究团队利用该数据集开发了新的检测算法，特别是在多语言和跨生成方法的场景下。这些工作不仅提升了检测模型的泛化能力，还为音频伪造检测领域的标准化评估提供了重要参考。此外，XMAD-Bench也促进了不同语言和文化背景下的音频安全研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集