RedFace
收藏arXiv2025-10-09 更新2025-11-19 收录
下载链接:
https://github.com/kikyou-220/RedFace
下载链接
链接失效反馈官方服务:
资源简介:
RedFace数据集是一个专门针对面部深度伪造的数据库,包含超过6万张伪造图像和1000个处理过的视频。该数据集通过9个商业在线平台生成,模拟现实世界的黑盒场景,并使用定制算法合成深度伪造图像,以捕捉现实世界中深度伪造创作者使用的多样性和不断发展的方法。RedFace数据集旨在解决现有深度伪造数据集在真实性、多样性和复杂度方面的不足,为深度伪造检测研究提供更接近现实世界的数据支持。
The RedFace dataset is a specialized database dedicated to facial deepfakes. It contains over 60,000 forged images and 1,000 processed videos. Generated through nine commercial online platforms to simulate real-world black-box scenarios, the dataset uses custom algorithms to synthesize deepfake images, capturing the diversity and evolving methods employed by real-world deepfake creators. The RedFace dataset aims to address the limitations of existing deepfake datasets in terms of authenticity, diversity and complexity, providing more real-world-aligned data support for deepfake detection research.
提供机构:
华中科技大学
创建时间:
2025-10-09
搜集汇总
数据集介绍

构建方式
在数字伪造技术日益泛滥的背景下,RedFace数据集采用现实导向的构建策略,通过整合9个商业在线平台生成深度伪造内容。该数据集基于CelebA真实人脸图像库,从中精选了1023个具有多样属性的身份,共7411张高质量图像作为源数据。针对四种主流伪造类型(全脸合成、人脸替换、属性操控和面部重演),分别设计了多阶段提示词优化、随机属性编辑和跨性别配对等定制化生成流程,最终汇集了超过6万张伪造图像和1000段 manipulated 视频,所有数据均附带详细的操作关键词和属性标注。
特点
RedFace的突出特点在于其高度模拟现实场景的多样性,覆盖了全脸合成、人脸替换、属性操控和面部重演四大深度伪造类型。数据集通过商业黑盒平台集成最新伪造技术,突破了传统学术数据集的单一生成方法限制,有效反映了真实网络环境中不断演变的伪造手段。其图像分辨率高、视觉逼真度强,且每张伪造图像均配有完整的操作元数据,为检测模型提供了丰富的跨域泛化测试基础。该数据集还特别注重属性平衡与自然度控制,通过多平台交叉验证确保了伪造样本的质量与复杂性。
使用方法
RedFace数据集适用于评估深度伪造检测模型的跨域泛化能力和现实场景适应性。研究人员可将数据集划分为训练、验证和测试子集(推荐比例8:1:1),针对特定伪造类型进行域内检测任务训练,或直接利用完整数据集进行跨域性能测试。该数据集支持对主流检测方法(如Xception、CViT、DIRE等)在多种退化条件下的鲁棒性评估,包括JPEG压缩、高斯模糊和分辨率变换等模拟社交网络传播的失真场景。通过提供的详细标注信息,用户可进一步分析不同伪造技术对检测性能的影响,推动更具泛化性的防御方案开发。
背景与挑战
背景概述
随着人工智能生成内容技术的迅猛发展,深度伪造技术通过生成对抗网络和扩散模型等工具,能够创造出高度逼真的人脸合成图像与视频,对社交媒体内容的真实性构成严峻威胁。RedFace数据集由华中科技大学等机构的研究团队于2025年提出,旨在弥补现有深度伪造检测数据集的不足。该数据集聚焦于真实场景中的伪造人脸,涵盖超过六万张伪造图像与一千段 manipulated 视频,通过整合九种商业在线平台的最新技术,模拟现实世界中的黑盒生成环境,显著提升了检测模型在复杂应用场景中的泛化能力。
当前挑战
RedFace数据集致力于解决深度伪造检测领域的两大核心挑战:其一,现有检测方法在面对多样化、高真实度的伪造类型时表现不佳,尤其在跨域评估中,模型准确率可能骤降至随机猜测水平;其二,数据构建过程中需克服商业平台黑盒生成技术的不可控性,确保覆盖全脸合成、人脸替换、属性操控与表情重演四类伪造场景,同时维持图像质量与标注一致性,以应对社交媒体传播中的图像退化问题。
常用场景
经典使用场景
在数字媒体安全领域,RedFace数据集被广泛用于评估深度伪造检测算法的泛化能力。该数据集通过整合9个商业在线平台生成的伪造图像与视频,模拟真实网络环境中的黑盒场景,为研究者提供了涵盖全脸合成、面部替换、属性篡改和表情重演四类典型伪造手法的测试基准。其超过6万张伪造图像和1000段篡改视频的规模,使得检测模型能够在多样化伪造技术下接受严格验证,尤其适用于跨域检测任务中模型鲁棒性的量化分析。
解决学术问题
RedFace有效解决了现有深度伪造数据集中存在的三大局限:伪造类型覆盖不全、生成方法单一化以及学术复现偏差问题。通过引入商业平台的黑盒生成技术,该数据集打破了传统仅依赖学术生成模型的桎梏,为检测算法在真实场景中的适应性评估提供了可靠基础。其详尽的操作关键词标注体系,进一步支撑了针对特定伪造手法的可解释性研究,推动了检测方法从实验室环境向实际应用的跨越。
衍生相关工作
基于RedFace的基准测试催生了多项创新研究,例如针对扩散模型伪造的DIRE检测器在该数据集上展现出卓越的跨域稳定性。研究者通过分析不同伪造类型间的特征差异,提出了融合频域与纹理分析的混合检测框架。此外,该数据集启发的对抗样本生成研究,推动了面向商业平台的黑盒攻击与防御技术发展,相关成果已延伸至视频深度伪造检测、生成模型水印等新兴研究方向。
以上内容由遇见数据集搜集并总结生成



