Fraud Academy

arXiv2025-10-01 更新2025-10-02 收录

下载链接：

https://github.com/C detection-test-protocol

下载链接

链接失效反馈

官方服务：

资源简介：

Fraud Academy数据集是微软开发的一个用于深度伪造语音检测的数据集。该数据集包含2263个电话通话片段，其中1120个包含伪造攻击。数据集通过模拟真实世界中的欺诈攻击序列，包括原始录音、深度伪造音频生成、音频信号失真等阶段，以创建一个更真实和多样化的数据集。该数据集旨在帮助开发能够更有效地泛化到现实世界的深度伪造语音检测系统。

The Fraud Academy Dataset is a resource developed by Microsoft for deepfake speech detection. It contains 2,263 telephone call clips, of which 1,120 include deepfake spoofing attacks. To build a more realistic and diverse dataset, it simulates real-world fraudulent attack workflows covering stages such as original audio recording, deepfake audio generation, and audio signal distortion. This dataset is intended to aid the development of deepfake speech detection systems that can generalize more effectively to real-world scenarios.

提供机构：

微软

创建时间：

2025-10-01

搜集汇总

数据集介绍

构建方式

在语音反欺诈研究领域，Fraud Academy数据集通过模拟真实世界欺诈攻击序列构建而成。该数据集招募80名参与者进行角色扮演实验，涵盖合法与欺诈性通话场景，参与者使用多种TTS工具生成深度伪造语音，并通过直接注入或扬声器播放方式呈现。数据采集过程采用多样化设备与全球多地点部署，确保涵盖16种呼叫设备类型与5类扬声器配置，最终形成包含2,263条通话片段的高保真语料库。

使用方法

作为专用于评估深度伪造检测系统泛化能力的测试集，该数据集需严格隔离于模型训练流程。研究者应在完成基础模型开发后，使用该数据集验证系统在真实电话信道条件下的性能表现。评估时建议采用分段检测策略，通过多时间窗口（2-15秒净语音）的决策融合来模拟实际通话场景，并重点关注在固定虚警率下的漏检率指标以衡量实用价值。

背景与挑战

背景概述

随着生成式人工智能技术的迅猛发展，恶意音频深度伪造的威胁日益加剧，促使学术界与工业界亟需构建有效的反欺诈检测系统。由微软研究团队于2025年提出的Fraud Academy数据集，聚焦于电话银行场景中的深度伪造语音检测，其创新性在于首次完整模拟了现实世界中欺诈攻击的全流程——从原始深度伪造音频生成、通过通信信道呈现，到最终任务交互的完整序列。该数据集通过整合80名参与者的多设备、多地域实时通话数据，突破了传统数据集仅关注原始合成音频的局限，为构建具有实际应用价值的检测模型提供了关键支撑。

当前挑战

在领域问题层面，传统深度伪造检测系统因训练数据缺乏现实性，难以应对真实通信场景中由电话网络传输、设备播放或直接音频注入引入的声学失真，导致模型泛化能力严重不足。构建过程中，Fraud Academy需克服多重挑战：一是需在可控实验环境下精确复现欺诈攻击链中各阶段的信号变形；二是协调全球参与者使用异构设备与多种文本转语音工具生成数据，确保多样性与真实性平衡；三是解决小规模现实数据与大规模实验室数据的有效融合问题，避免模型过拟合或欠拟合。

常用场景

经典使用场景

在音频伪造检测领域，Fraud Academy数据集通过模拟真实电话银行欺诈场景，构建了包含直接注入和扬声器播放两种呈现方式的深度伪造语音样本。该数据集首次将完整欺诈攻击序列（生成、呈现、任务阶段）纳入统一框架，为研究社区提供了评估检测系统泛化能力的基准环境。其多设备、多地域的采集策略，有效捕捉了通信信道失真和对话动态特征，弥补了传统数据集仅关注原始伪造音频的局限性。

解决学术问题

该数据集主要解决了深度伪造检测领域泛化能力不足的核心问题。传统研究方法因依赖理想化实验室数据，导致检测模型在真实场景中性能骤降。通过引入电话信道传输失真、多设备播放变异及实时对话动态，该数据集打破了模型对纯净音频特征的过拟合，推动检测技术从实验室指标向实际应用效能转变。其构建方法论揭示了数据真实性对模型性能的影响远超模型规模扩展，为优化研究资源配置提供了实证依据。

实际应用

在金融安全防护场景中，该数据集直接支撑电话银行欺诈防御系统的开发。通过还原欺诈者使用TTS工具伪造目标声纹、通过通信设备呈现伪造语音、与客服进行实时对话的全流程，为金融机构构建深度伪造语音实时检测系统提供训练基础。其涵盖的多种设备组合与全球地域特征，确保了检测系统在跨设备、跨网络环境下的鲁棒性，对预防声纹仿冒导致的资金转移欺诈具有显著应用价值。

数据集最近研究