five

MAVOS-DD

收藏
github2025-07-31 更新2025-08-22 收录
下载链接:
https://github.com/CroitoruAlin/MAVOS-DD
下载链接
链接失效反馈
官方服务:
资源简介:
MAVOS-DD:多语言音视频开放集深度伪造检测基准数据集

MAVOS-DD: Multilingual Audio-Visual Open-Set Deepfake Detection Benchmark Dataset
创建时间:
2025-07-27
原始信息汇总

MAVOS-DD 数据集概述

数据集名称

MAVOS-DD: Multilingual Audio-Video Open-Set Deepfake Detection Benchmark

数据集来源

官方存储库地址:https://github.com/CroitoruAlin/MAVOS-DD

数据集下载

下载地址:https://huggingface.co/datasets/unibuc-cs/MAVOS-DD

许可协议

CC BY-NC-SA 4.0 许可证(https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en)

数据集描述

多语言音视频开放集深度伪造检测基准数据集

相关论文

标题:MAVOS-DD: Multilingual Audio-Video Open-Set Deepfake Detection Benchmark

作者:Florinel-Alin Croitoru, Vlad Hondru, Marius Popescu, Radu Tudor Ionescu, Fahad Shahbaz Khan, Mubarak Shah

年份:2025

arXiv地址:https://arxiv.org/abs/2505.11109

代码基础

基于以下项目的代码:

  • MRDF:https://github.com/Vincent-ZHQ/MRDF/tree/main
  • DeepfakeBench:https://github.com/SCLBD/DeepfakeBench
  • OpenAVFF:https://github.com/JoeLeelyf/OpenAVFF

模型权重

预训练模型权重下载地址:https://drive.google.com/drive/folders/1TVPIrGykPJtRieESx1zn81-ATnGKY6hk?usp=sharing

搜集汇总
数据集介绍
main_image_url
构建方式
在多媒体伪造检测领域,MAVOS-DD数据集通过系统化采集与合成手段构建而成。该数据集整合了多语言环境下的音频与视频样本,涵盖真实与深度伪造内容,采用严格的数据清洗与标注流程,确保样本的多样性与准确性。其构建过程注重开源数据资源的合法利用,并遵循学术伦理标准,为研究者提供了可靠的多模态基准数据。
特点
MAVOS-DD的显著特点在于其多语言与多模态的开放性设计。数据集包含丰富的音频与视频深度伪造样本,支持跨语言与跨模态的检测任务,并涵盖开放集场景下的未知伪造类型。其样本来源多样,覆盖不同语言背景与文化语境,增强了模型在真实环境中的泛化能力与鲁棒性。
使用方法
研究者可通过Hugging Face平台直接下载MAVOS-DD数据集,并依据提供的许可证条款合规使用。数据集适用于训练与评估多模态深度伪造检测模型,用户可参照开源代码库中的实验流程进行模型训练与推理。此外,预训练模型权重已公开,便于快速实现基准测试与跨领域验证。
背景与挑战
背景概述
随着深度伪造技术的快速发展,多媒体内容真实性验证成为数字安全领域的核心议题。MAVOS-DD数据集由Florinel-Alin Croitoru等学者于2025年联合构建,旨在应对多语言环境下音视频深度伪造检测的开放性挑战。该数据集由多个国际知名研究机构共同支持,重点关注跨语言、跨模态的伪造内容识别,为深度伪造检测算法提供了标准化评估基准,显著推动了多媒体取证领域的研究进展。
当前挑战
该数据集致力于解决多语言音视频开放集深度伪造检测这一复杂问题,面临伪造技术多样性导致的泛化性挑战,以及跨语言语音与视觉特征对齐的难题。构建过程中需克服多源数据采集与标注的一致性保障,同时需平衡不同语言和文化背景下伪造样本的分布差异,确保数据集的代表性和公平性。
常用场景
经典使用场景
在多媒体伪造检测领域,MAVOS-DD数据集作为多模态开放集基准,主要应用于跨语言音视频深度伪造的识别与验证。研究者利用其丰富的多语言音频与视频配对样本,训练深度学习模型以区分真实内容与合成媒体,尤其在处理未知伪造方法的开放集场景中展现出色性能。
衍生相关工作
基于MAVOS-DD数据集,研究者开发了多项经典工作,如跨模态注意力融合网络和多尺度伪造特征提取框架。这些工作显著提升了开放集检测的准确率,并衍生出如动态阈值适应机制和跨语言伪造模式迁移学习等创新方法,推动了整个深度伪造检测领域的技术演进。
数据集最近研究
最新研究方向
随着深度伪造技术在多模态领域的快速发展,MAVOS-DD数据集作为多语言音视频开放集深度伪造检测基准,正推动着检测技术向跨模态融合与泛化能力的前沿探索。该数据集整合了多语言环境下的音频与视频信息,为应对未知伪造方法的开放集检测提供了重要实验平台。当前研究热点集中于开发能够同时处理视听信号并适应多语言场景的深度学习模型,以应对日益复杂的深度伪造攻击。这一方向不仅提升了检测系统的鲁棒性,还对网络安全和数字身份认证领域产生了深远影响,为构建可信赖的人工智能生态系统提供了关键技术支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作