CASIA-SURF

Name: CASIA-SURF
Creator: 中国科学院自动化研究所
Published: 2020-02-05 01:58:24
License: 暂无描述

arXiv2020-02-05 更新2024-06-21 收录

下载链接：

https://sites.google.com/qq.com/face-anti-spooﬁng/welcome/challengecvpr2019?authuser=0

下载链接

链接失效反馈

官方服务：

资源简介：

CASIA-SURF是一个大规模多模态面部反欺骗基准数据集，由中国科学院自动化研究所创建。该数据集包含1000个不同性别、年龄和室内环境的主题，每个主题有1个真实视频和6个欺骗视频，总计21000个视频。数据集提供RGB、深度和红外三种模态的数据，旨在通过多模态信息提高面部识别系统的安全性。创建过程中，使用Intel RealSense SR300相机在多种室内环境下采集数据，确保了数据的真实性和多样性。CASIA-SURF数据集主要用于面部反欺骗技术的研究，特别是在面部支付、解锁等安全敏感场景中的应用。

CASIA-SURF is a large-scale multimodal facial anti-spoofing benchmark dataset developed by the Institute of Automation, Chinese Academy of Sciences. It encompasses 1000 subjects with varying genders, ages and indoor settings, where each subject is associated with 1 genuine video and 6 spoofing videos, resulting in a total of 21,000 videos. The dataset provides data in three modalities: RGB, depth and infrared, with the goal of enhancing the security of facial recognition systems through multimodal information. During its construction, data was collected using Intel RealSense SR300 cameras across diverse indoor environments, ensuring the authenticity and diversity of the dataset. The CASIA-SURF dataset is primarily utilized for research on facial anti-spoofing technologies, particularly for applications in security-sensitive scenarios such as facial payment and device unlocking.

提供机构：

中国科学院自动化研究所

创建时间：

2019-08-28

搜集汇总

数据集介绍

构建方式

在面部防伪研究领域，数据集的规模与模态多样性是推动算法发展的关键。CASIA-SURF数据集的构建采用了英特尔RealSense SR300相机，同步采集RGB、深度和红外三种模态的视频流，确保了多模态数据的时间与空间对齐。数据采集过程涵盖了1000名受试者，在多样化室内环境下进行，每位受试者录制1段真实面部视频及6种基于打印照片的伪造攻击视频，攻击方式包括平面与曲面照片以及眼部、鼻部、嘴部区域的裁剪组合。通过Dlib工具进行面部检测，并利用PRNet算法完成三维重建与对齐，最终生成高质量、对齐的多模态面部图像，形成了包含21,000段视频的大规模基准数据集。

使用方法

CASIA-SURF数据集的使用方法遵循系统化的评估框架。研究人员可利用其提供的训练、验证与测试子集进行模型开发与调优，其中训练集包含300名受试者的多模态数据，验证集用于超参数选择，测试集则用于最终性能评估。数据集支持两种评估协议：模态内评估，即在同模态数据上训练与测试；跨模态评估，训练与测试在不同模态间进行，以检验算法的泛化能力。评估时可采用ROC曲线及TPR@FPR指标，辅以传统的APCER、NPCER与ACER度量，从而全面衡量面部防伪算法的效能与鲁棒性。

背景与挑战

背景概述

随着人脸识别技术的广泛应用，其安全性问题日益凸显，尤其是针对打印攻击、视频重放攻击等呈现攻击的防御需求。在这一背景下，中国科学院自动化研究所模式识别国家重点实验室联合澳门科技大学、百度研究院等机构的研究团队于2018年推出了CASIA-SURF数据集。该数据集旨在解决现有活体检测数据集中样本规模有限、模态单一等瓶颈问题，通过集成RGB、深度和红外三种模态，涵盖1000名受试者的21000段视频，成为当时规模最大、模态最丰富的公开活体检测基准。其核心研究问题聚焦于多模态融合下的面部呈现攻击检测，推动了活体检测算法在复杂真实场景中的泛化能力与鲁棒性提升，对生物特征识别领域的安全应用产生了深远影响。

当前挑战

CASIA-SURF数据集所针对的活体检测领域面临多重挑战：其一，传统单模态（如RGB）方法在应对新型攻击（如3D面具）时泛化能力不足；其二，现有数据集的受试者规模通常不超过170人，难以充分模拟真实应用中的个体多样性，易导致模型过拟合。在数据集构建过程中，研究团队需克服多模态数据同步采集与对齐的技术难题，确保RGB、深度和红外信息在时空上的一致性；同时，设计多样化的攻击类型（如平面/弯曲照片结合器官裁剪）以增强数据复杂性，并建立跨模态评估协议，以探索算法在异构模态间的迁移能力，这些挑战共同塑造了数据集的创新性与实用价值。

常用场景

经典使用场景

在生物特征识别领域，人脸防伪检测是确保身份验证系统安全性的关键环节。CASIA-SURF数据集以其大规模多模态特性，为研究人员提供了评估和优化防伪算法的理想平台。该数据集包含RGB、深度和红外三种模态数据，覆盖了1000名受试者的21000个视频样本，使得算法能够在多样化的攻击场景下进行训练与测试，从而有效模拟真实世界中的复杂环境。

解决学术问题

CASIA-SURF数据集解决了人脸防伪研究中长期存在的两个核心问题：一是先前数据集受限于较少的受试者数量（通常不超过170名）和模态单一性（多为RGB数据），导致算法泛化能力不足；二是缺乏跨模态评估协议，难以探索多模态融合的潜力。通过提供大规模多模态数据及全面的评估指标（如ROC曲线），该数据集推动了防伪算法在应对打印攻击、弯曲照片攻击等多样化攻击方式时的鲁棒性研究，并为跨模态学习提供了新的研究方向。

实际应用

在实际应用中，CASIA-SURF数据集为金融支付、手机解锁和门禁系统等场景的人脸识别安全提供了重要支撑。其多模态数据（RGB、深度、红外）能够有效区分真实人脸与基于照片或视频的伪造攻击，尤其在深度信息对距离敏感、红外数据反映热量辐射的特性下，系统可更精准地检测出二维平面攻击。数据集的多样攻击类型（如裁剪眼睛、鼻子区域）进一步模拟了现实中的复杂欺骗手段，有助于开发出适用于高安全要求环境的防伪解决方案。

数据集最近研究