MAVOS-DD

github2025-07-31 更新2025-08-22 收录

下载链接：

https://github.com/CroitoruAlin/MAVOS-DD

下载链接

链接失效反馈

官方服务：

资源简介：

MAVOS-DD：多语言音视频开放集深度伪造检测基准数据集

MAVOS-DD: Multilingual Audio-Visual Open-Set Deepfake Detection Benchmark Dataset

创建时间：

2025-07-27

原始信息汇总

MAVOS-DD 数据集概述

数据集名称

MAVOS-DD: Multilingual Audio-Video Open-Set Deepfake Detection Benchmark

数据集来源

官方存储库地址：https://github.com/CroitoruAlin/MAVOS-DD

数据集下载

下载地址：https://huggingface.co/datasets/unibuc-cs/MAVOS-DD

许可协议

CC BY-NC-SA 4.0 许可证（https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en）

数据集描述

多语言音视频开放集深度伪造检测基准数据集

代码基础

基于以下项目的代码：

MRDF：https://github.com/Vincent-ZHQ/MRDF/tree/main
DeepfakeBench：https://github.com/SCLBD/DeepfakeBench
OpenAVFF：https://github.com/JoeLeelyf/OpenAVFF

模型权重

预训练模型权重下载地址：https://drive.google.com/drive/folders/1TVPIrGykPJtRieESx1zn81-ATnGKY6hk?usp=sharing

搜集汇总

数据集介绍

构建方式

在多媒体伪造检测领域，MAVOS-DD数据集通过系统化采集与合成手段构建而成。该数据集整合了多语言环境下的音频与视频样本，涵盖真实与深度伪造内容，采用严格的数据清洗与标注流程，确保样本的多样性与准确性。其构建过程注重开源数据资源的合法利用，并遵循学术伦理标准，为研究者提供了可靠的多模态基准数据。

特点

MAVOS-DD的显著特点在于其多语言与多模态的开放性设计。数据集包含丰富的音频与视频深度伪造样本，支持跨语言与跨模态的检测任务，并涵盖开放集场景下的未知伪造类型。其样本来源多样，覆盖不同语言背景与文化语境，增强了模型在真实环境中的泛化能力与鲁棒性。

使用方法

研究者可通过Hugging Face平台直接下载MAVOS-DD数据集，并依据提供的许可证条款合规使用。数据集适用于训练与评估多模态深度伪造检测模型，用户可参照开源代码库中的实验流程进行模型训练与推理。此外，预训练模型权重已公开，便于快速实现基准测试与跨领域验证。

背景与挑战

背景概述

随着深度伪造技术的快速发展，多媒体内容真实性验证成为数字安全领域的核心议题。MAVOS-DD数据集由Florinel-Alin Croitoru等学者于2025年联合构建，旨在应对多语言环境下音视频深度伪造检测的开放性挑战。该数据集由多个国际知名研究机构共同支持，重点关注跨语言、跨模态的伪造内容识别，为深度伪造检测算法提供了标准化评估基准，显著推动了多媒体取证领域的研究进展。

当前挑战

该数据集致力于解决多语言音视频开放集深度伪造检测这一复杂问题，面临伪造技术多样性导致的泛化性挑战，以及跨语言语音与视觉特征对齐的难题。构建过程中需克服多源数据采集与标注的一致性保障，同时需平衡不同语言和文化背景下伪造样本的分布差异，确保数据集的代表性和公平性。

常用场景

经典使用场景

在多媒体伪造检测领域，MAVOS-DD数据集作为多模态开放集基准，主要应用于跨语言音视频深度伪造的识别与验证。研究者利用其丰富的多语言音频与视频配对样本，训练深度学习模型以区分真实内容与合成媒体，尤其在处理未知伪造方法的开放集场景中展现出色性能。

衍生相关工作

基于MAVOS-DD数据集，研究者开发了多项经典工作，如跨模态注意力融合网络和多尺度伪造特征提取框架。这些工作显著提升了开放集检测的准确率，并衍生出如动态阈值适应机制和跨语言伪造模式迁移学习等创新方法，推动了整个深度伪造检测领域的技术演进。

数据集最近研究