UniAttackDataPlus

Name: UniAttackDataPlus
Creator: 中国科学院自动化研究所多模态人工智能系统国家重点实验室
Published: 2025-05-20 10:07:48
License: 暂无描述

arXiv2025-05-20 更新2025-05-22 收录

下载链接：

http://arxiv.org/abs/2505.13327v2

下载链接

链接失效反馈

官方服务：

资源简介：

UniAttackDataPlus是目前公开可用的最大的统一人脸攻击检测数据集，采用可解释的层次化方式，涵盖了2875个身份及其对应的54种伪造样本，共计697347个视频。数据集由中国科学院自动化研究所多模态人工智能系统国家重点实验室创建，旨在为研究人员提供更广泛的攻击类型和样本，以促进统一人脸攻击检测模型的发展。

UniAttackDataPlus is currently the largest publicly available unified face attack detection dataset. It adopts an interpretable hierarchical framework, covering 2875 identities along with their corresponding 54 types of spoofing samples, totaling 697,347 video clips. This dataset was developed by the State Key Laboratory of Multimodal Artificial Intelligence Systems, Institute of Automation, Chinese Academy of Sciences, and aims to provide researchers with a broader range of attack types and samples to facilitate the development of unified face attack detection models.

提供机构：

中国科学院自动化研究所多模态人工智能系统国家重点实验室

创建时间：

2025-05-20

搜集汇总

数据集介绍

构建方式

UniAttackDataPlus数据集的构建采用了身份一致性的方法，确保每个身份包含完整的攻击类型，从而减少身份和领域噪声。数据集涵盖了2,875个身份，每个身份应用了54种不同的攻击方法，包括14种物理攻击和40种数字攻击，共计697,347个视频。数据预处理包括使用MTCNN进行人脸检测和裁剪，并手动分配类别标签、攻击类型标签和分层标签。

使用方法

UniAttackDataPlus数据集的使用方法包括四个协议：ID分区协议P1、跨攻击方法协议P2、跨攻击类型协议P3和向下兼容协议P3.2。这些协议旨在评估模型在不同场景下的性能，包括未知身份和未见过的攻击方法。此外，数据集还设计了交叉数据集测试基准，以评估模型的泛化能力。

背景与挑战

背景概述

UniAttackDataPlus是由中国科学院自动化研究所、澳门科技大学等机构的研究团队于2021年提出的统一人脸攻击检测基准数据集。作为当前规模最大、攻击类型最全面的公开数据集，它包含2,875个身份共697,347段视频，涵盖54种物理和数字攻击方式。该数据集采用身份一致性构建方法，通过分层结构组织攻击类型，为模型提供了更广阔的学习空间。其创新性的分层提示调优框架HiPTune，通过探索多语义空间的分类标准，显著提升了模型对未知攻击的检测能力，推动了人脸数据安全领域的发展。

当前挑战

UniAttackDataPlus主要面临两大挑战：领域问题方面，现有模型难以同时应对物理呈现攻击和数字伪造攻击的多样性，且对未知攻击类型的泛化能力不足；构建过程方面，需要平衡大规模数据采集与身份隐私保护，精确标注54种攻击类型的层次关系，并确保不同攻击样本在特征空间的可区分性。此外，数据集中物理攻击的材质反射特性与数字攻击的像素级伪影存在显著差异，增加了统一特征提取的难度。

常用场景

经典使用场景

UniAttackDataPlus作为当前最全面的统一人脸攻击检测基准数据集，其经典使用场景主要集中在跨模态攻击检测模型的训练与评估。通过整合54种物理与数字攻击类型的697,347个视频样本，该数据集为研究者提供了从基础打印攻击到先进生成对抗网络（如DiffSwap、Roop等）的全方位测试环境。其分层标注结构（如2D/3D物理攻击、数字编辑/对抗/生成攻击的三级分类）支持算法在粗粒度到细粒度层面的性能验证，特别适用于验证模型在协议P2（跨攻击方法泛化）和P3（低阶到高阶攻击迁移）等复杂场景下的鲁棒性。

解决学术问题

该数据集有效解决了人脸安全领域两大核心学术问题：一是传统孤立训练PAD（呈现攻击检测）与FFD（人脸伪造检测）模型导致的未知攻击脆弱性问题，通过身份一致性构建和分层攻击类型覆盖，使模型能同时学习物理介质攻击与数字编辑攻击的共性特征；二是缺乏可信分类标准导致的模型可解释性不足，其配套的HiPTune框架通过视觉提示树（VP-Tree）实现多语义空间分类准则的自适应融合，在跨数据集测试中将EER（等错误率）降低至6.99%，显著提升了模型对新兴深度伪造技术的泛化能力。

实际应用

在实际应用层面，UniAttackDataPlus已成功部署于金融支付身份核验、智能手机活体检测等高风险场景。例如，其包含的14种物理攻击（如透明树脂3D面具）和40种数字攻击（如IP-Adapter生成的提示驱动伪造）可模拟真实世界攻击多样性，帮助支付宝等企业构建混合攻击防御系统。数据集支持的动态提示交互（DPI）模块能实时识别视频会议中的Deepfake换脸攻击，在FaceForensics++测试集上达到93.12%的AUC性能，较传统单模态检测方案提升17.8%。

数据集最近研究