UniAttackDataPlus

Name: UniAttackDataPlus
Creator: 中国科学院自动化研究所模式识别国家重点实验室
Published: 2025-05-20 00:35:45
License: 暂无描述

arXiv2025-05-20 更新2025-05-21 收录

下载链接：

http://arxiv.org/abs/2505.13327v1

下载链接

链接失效反馈

官方服务：

资源简介：

UniAttackDataPlus是目前最大的公开统一的攻击检测数据集，包含2,875个身份及其相应的54种伪造样本，共697,347个视频。该数据集采用分层方法构建，从粗到细地分类各种攻击类型，为研究者提供了一个可解释的框架，有助于设计相应的算法。该数据集的采集背景多样化，数据量大，攻击类型丰富，为训练和评估面部攻击检测模型提供了强大的资源。

UniAttackDataPlus is currently the largest publicly available unified attack detection dataset. It comprises 2,875 identities and their corresponding 54 types of forged samples, totaling 697,347 videos. Constructed using a hierarchical approach that classifies various attack types from coarse to fine-grained, this dataset provides researchers with an interpretable framework to facilitate the design of corresponding algorithms. Featuring diverse acquisition backgrounds, large-scale data and rich attack categories, it serves as a powerful resource for training and evaluating facial attack detection models.

提供机构：

中国科学院自动化研究所模式识别国家重点实验室

创建时间：

2025-05-20

原始信息汇总

数据集概述

基本信息

标题: Benchmarking Unified Face Attack Detection via Hierarchical Prompt Tuning
arXiv ID: arXiv:2505.13327v1
提交日期: 2025年5月19日
最新版本日期: 2025年5月20日
学科分类: Computer Science > Computer Vision and Pattern Recognition (cs.CV)
DOI: 10.48550/arXiv.2505.13327

作者

Ajian Liu, Haocheng Yuan, Xiao Guo, Hui Ma, Wanyi Zhuang, Changtao Miao, Yan Hong, Chuanbiao Song, Jun Lan, Qi Chu, Tao Gong, Yanyan Liang, Weiqiang Wang, Jun Wan, Xiaoming Liu, Zhen Lei

摘要

研究背景: Presentation Attack Detection (PAD) 和 Face Forgery Detection (FFD) 分别用于保护面部数据免受物理介质攻击和数字编辑攻击。但单独训练这两种模型使其易受未知攻击影响且部署负担重。
数据集贡献: 提出UniAttackData+，包含2,875个身份及其54种伪造样本，总计697,347个视频，是目前最全面和复杂的伪造技术集合。
方法贡献: 提出Hierarchical Prompt Tuning Framework (HiPTune)，通过Visual Prompt Tree分层探索多种分类规则，并动态调整提示以提取判别性特征。
实验结果: 在12个数据集上验证了方法的有效性。

数据集详情

名称: UniAttackData+
规模: 697,347个视频
内容: 包含2,875个身份及其54种伪造样本

方法

框架: Hierarchical Prompt Tuning Framework (HiPTune)
关键模块:
- Visual Prompt Tree: 分层探索分类规则
- Dynamically Prompt Integration: 将视觉提示投影到文本编码器以获得更准确的语义

相关链接

PDF: View PDF
HTML (experimental): View HTML

搜集汇总

数据集介绍

构建方式

UniAttackDataPlus数据集通过身份一致性和层次化结构构建，涵盖了2,875个身份及其对应的54种伪造样本，总计697,347个视频。数据采集自三个不同种族（非洲、东亚和中亚），并在多种光照条件、背景和采集设备下进行。每个身份均应用了14种物理攻击和40种数字攻击方法，确保了数据集的多样性和全面性。物理攻击包括2D和3D攻击，数字攻击则分为数字编辑、对抗攻击和生成攻击三类。数据集通过分层标签和结构化设计，提供了丰富的先验知识，便于研究者设计相应算法。

特点

UniAttackDataPlus是目前公开的最大规模统一人脸攻击检测数据集，具有广泛的攻击类型覆盖和最小干扰。其特点包括：1) 规模庞大，包含697,347个视频片段；2) 攻击类型多样，涵盖54种攻击方法；3) 解释性强，通过分层结构提供清晰的攻击类型分类；4) 身份一致性设计，减少身份和领域噪声。此外，数据集还设计了四种协议和跨数据集测试基准，以评估模型在不同场景下的性能。

使用方法

UniAttackDataPlus数据集适用于训练和评估统一人脸攻击检测模型。研究者可以通过四种协议（ID分区协议、跨攻击方法协议、跨攻击类型协议和向下兼容协议）评估模型性能。数据集的分层结构为算法设计提供了先验知识，例如HiPTune基线方法利用类似的分层方法开发提示调优策略。此外，跨数据集测试基准可用于评估模型的泛化能力。数据集的结构化设计和丰富标签使其成为人脸数据安全领域的强大基准。

背景与挑战

背景概述

UniAttackDataPlus是由中国科学院自动化研究所、澳门科技大学、密歇根州立大学等机构的研究团队于2021年提出的统一人脸攻击检测基准数据集。该数据集旨在解决传统孤立训练的面部反欺骗（FAS）和面部伪造检测（FFD）模型在面对未知攻击时泛化能力不足的问题。作为目前规模最大、攻击类型最全面的公开数据集，UniAttackData+包含2,875个身份共计697,347段视频，涵盖54种攻击类型（14种物理攻击和40种数字攻击），并以可解释的层次化结构组织数据。该数据集的创新性体现在身份一致性设计、分层标注体系以及跨模态评估协议，为构建鲁棒的统一人脸攻击检测模型提供了重要研究基础。

当前挑战

UniAttackDataPlus主要应对两大核心挑战：在领域问题层面，传统方法难以同时处理物理介质攻击（如3D面具）和数字编辑攻击（如DeepFake）的异构特征分布，且单一分类标准无法适应快速演进的伪造技术；在构建过程层面，研究团队需解决大规模身份一致性数据采集的复杂性、54种攻击类型的标准化实施，以及跨模态特征对齐等难题。具体表现为：1）物理攻击与数字攻击在像素级和语义级存在显著差异；2）新型生成式攻击（如扩散模型伪造）与传统攻击的检测特征不兼容；3）分层标注体系需要平衡先验知识引入与模型自主学习的关系。

常用场景

经典使用场景

UniAttackDataPlus数据集在统一人脸攻击检测（UAD）领域具有广泛的应用场景。该数据集通过包含54种攻击类型和697,347个视频样本，为研究人员提供了一个全面且多样化的基准测试平台。其经典使用场景包括训练和评估能够同时检测物理攻击（如打印攻击和3D面具攻击）和数字攻击（如深度伪造和对抗攻击）的模型。数据集的结构化设计和身份一致性特点使其成为开发高效、鲁棒的人脸攻击检测算法的理想选择。

衍生相关工作

UniAttackDataPlus的发布催生了一系列相关研究工作。基于该数据集，研究人员提出了Hierarchical Prompt Tuning (HiPTune)框架，通过分层提示策略自适应地整合多语义空间的分类标准。此外，数据集还启发了对视觉语言模型在UAD任务中的应用探索，如CLIP-based方法的性能优化。这些衍生工作不仅扩展了数据集的用途，还推动了人脸攻击检测算法在效率和准确性方面的显著提升。

数据集最近研究