ReplayDF

Hugging Face2025-05-22 更新2025-05-23 收录

下载链接：

https://huggingface.co/datasets/mueller91/ReplayDF

下载链接

链接失效反馈

官方服务：

资源简介：

ReplayDF数据集是一个用于评估重放攻击对音频深度伪造检测系统影响的数据集。它包含了从M-AILABS和MLAAD v5数据集派生的重录合成语音，使用了109种独特的扬声器-麦克风组合，跨越六种语言和四种TTS模型，在不同的声学环境中录制。该数据集用于非商业研究，以支持开发鲁棒和泛化的深度伪造检测系统。

The ReplayDF dataset is a curated dataset for assessing the impact of replay attacks on audio deepfake detection systems. It includes re-recorded synthetic speech derived from the M-AILABS and MLAAD v5 datasets. Utilizing 109 unique speaker-microphone combinations, the dataset covers six languages and four TTS models, with all recordings conducted in diverse acoustic environments. This dataset is intended for non-commercial research purposes to support the development of robust and generalizable deepfake detection systems.

创建时间：

2025-05-21

原始信息汇总

ReplayDF 数据集概述

基本信息

许可证: Attribution-NonCommercial-ShareAlike 4.0 International (CC-BY-NC-4.0)
任务类别: 音频分类
支持语言: 英语 (en)、法语 (fr)、德语 (de)、波兰语 (pl)、西班牙语 (es)、意大利语 (it)
标签: ReplayDF, Audio-Deepfake, Replay-Attack, Spoof, Replay
数据集名称: ReplayDF
数据规模: 100K < n < 1M

数据集简介

ReplayDF 是一个用于评估重放攻击对音频深度伪造检测系统影响的数据集。数据集包含从 M-AILABS 和 MLAAD v5 重新录制的合成语音，覆盖109种独特的扬声器-麦克风组合，涉及六种语言和四种TTS模型，并在多样化的声学环境中录制。

数据集结构

ReplayDF/ ├── aux/ │ ├── <UID1>/ # 包含设置信息、录制的正弦扫描、RIR（源自正弦扫描） │ ├── <UID2>/ │ └── ... ├── wav/ │ ├── <UID1>/ │ │ ├── spoof # 重新录制的音频样本（伪造） │ │ ├── benign # 重新录制的音频样本（良性） │ │ └── meta.csv # 该UID录制的元数据 │ ├── <UID2>/ │ │ ├── spoof
│ │ ├── benign
│ │ └── meta.csv
│ └── ... ├── mos/ │ └── mos.png # MOS评分图 │ └── mos_scores # 单个MOS评分

下载方式

bash sudo apt-get install git-lfs git lfs install git clone https://huggingface.co/datasets/mueller91/ReplayDF

引用格式

@article{muller2025replaydf, title = {Replay Attacks Against Audio Deepfake Detection}, author = {Nicolas Müller and Piotr Kawa and Wei-Herng Choong and Adriana Stan and Aditya Tirumala Bukkapatnam and Karla Pizzi and Alexander Wagner and Philip Sperl}, journal={Interspeech 2025}, year = {2025}, }

资源链接

平均意见分数 (MOS) 评分标准

评分	描述	语音质量	失真（背景噪声、过载等）
5	优秀	清晰	不可察觉
4	良好	清晰	轻微可察觉，但不令人讨厌
3	一般	可理解	可察觉且轻微令人讨厌
2	差	可理解	可察觉且令人讨厌
1	非常差	勉强可理解	非常令人讨厌且不可接受
e	错误	听不见	严重

搜集汇总

数据集介绍

构建方式

在音频深度伪造检测领域，ReplayDF数据集的构建采用了严谨的实验设计。该数据集通过109种独特的扬声器-麦克风组合，对源自M-AILABS和MLAAD v5数据集的合成语音进行重新录制，覆盖六种语言和四种文本转语音模型。录制过程模拟了真实场景中的重放攻击，并在多样化声学环境下完成，每个样本均配有详细的元数据记录，包括设备配置、环境参数等信息。

特点

作为专注于重放攻击影响研究的音频数据集，ReplayDF具有显著的多维特性。其核心价值在于包含大量经过实际重放录制的伪造样本，这些样本展现了不同设备组合和声学环境下的失真特征。数据集涵盖英语、法语、德语等六种语言，并整合了四种主流TTS系统的输出，为研究跨语言和跨模型的检测鲁棒性提供了可能。特别值得注意的是，所有样本均经过专业的主观质量评估(MOS)，为量化重放攻击的感知质量影响提供了可靠依据。

使用方法

该数据集的使用需遵循非商业研究许可。研究者可通过Git LFS工具完整下载数据集，其目录结构清晰划分为原始音频、辅助信息和质量评分三个主要部分。典型应用场景包括：训练和评估抗重放攻击的深度伪造检测模型，分析不同设备配置对检测性能的影响，以及研究声学环境变化与检测错误率的相关性。使用时应特别注意区分spoof（伪造）和benign（良性）样本目录，并参考附带的meta.csv文件获取详细的样本属性信息。

背景与挑战

背景概述

ReplayDF数据集由Nicolas Müller等研究人员于2025年构建，旨在评估重放攻击对音频深度伪造检测系统的影响。该数据集由多国研究团队联合开发，包含来自M-AILABS和MLAAD v5数据集的合成语音重录样本，覆盖六种语言和四种文本转语音模型，采用109种独特的扬声器-麦克风组合在不同声学环境下录制。作为Interspeech 2025会议的研究成果，该数据集为音频深度伪造检测领域提供了首个系统性的重放攻击基准，推动了对抗环境下检测模型的鲁棒性研究。

当前挑战

该数据集主要解决音频深度伪造检测系统在真实场景中面临的挑战，特别是重放攻击导致的性能退化问题。构建过程中需克服多重技术难题：跨语言语音样本的声学一致性控制、多设备组合下的信号保真度维持，以及复杂环境噪声对语音质量的干扰。数据采集阶段需精确设计扬声器-麦克风的物理配置矩阵，并通过主观平均意见分(MOS)体系量化评估音频失真度，这些因素显著增加了数据集的构建复杂度。

常用场景

经典使用场景

在音频伪造检测领域，ReplayDF数据集被广泛应用于评估重放攻击对现有检测系统的影响。通过模拟真实场景中的声学环境变化和多样化的录音设备组合，该数据集为研究人员提供了标准化的测试平台，用以验证检测算法在复杂条件下的鲁棒性。多语言覆盖和不同TTS模型的引入，进一步增强了测试场景的全面性。

实际应用

在实际应用中，ReplayDF数据集为金融身份认证、智能客服安全防护等关键场景提供了重要的测试依据。金融机构可借助该数据集评估声纹识别系统在面临录音重放攻击时的脆弱性，进而优化安全策略。智能设备制造商也能利用这些数据改进语音交互系统的防伪能力，提升产品安全性。

衍生相关工作

基于ReplayDF数据集的研究催生了一系列创新性工作，包括抗重放攻击的端到端检测模型、基于声学特征增强的防御算法等。这些衍生研究显著推动了音频伪造检测领域的发展，其中多项成果已在Interspeech等顶级会议上发表，形成了完整的技术演进路线。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集