five

CASIA-SURF

收藏
arXiv2025-09-30 收录
下载链接:
https://sites.google.com/qq.com/face-anti-spoofing/welcome/challengecvpr2019?authuser=0
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为CASIA-SURF,专为面部防伪任务设计,包含了RGB、深度和红外三种模态的数据。在该数据集中,我们遵循了内部测试协议。其规模包括29,000个训练样本、1,000个验证样本以及57,000个测试样本。该数据集的任务是进行多模态分类。

The dataset named CASIA-SURF is specifically designed for facial anti-spoofing tasks, containing three modalities of data: RGB, depth, and infrared. Internal testing protocols were followed for this dataset. It includes 29,000 training samples, 1,000 validation samples, and 57,000 test samples. The task of this dataset is multimodal classification.
提供机构:
CASIA
搜集汇总
数据集介绍
main_image_url
构建方式
在面部防伪领域,现有数据集常受限于样本规模与模态多样性。CASIA-SURF数据集的构建采用英特尔RealSense SR300相机同步采集RGB、深度与红外三种模态视频,覆盖1000名受试者在多样化室内环境下的动态面部数据。每位受试者录制1段真实面部视频及6种基于打印照片的伪造攻击视频,攻击方式涵盖平面与弯曲照片的局部裁剪组合。数据预处理阶段通过Dlib工具进行面部检测,并利用PRNet算法完成三维重建与对齐,最终生成包含约49.2万张对齐图像的大规模多模态基准数据集。
特点
CASIA-SURF数据集在规模与模态丰富性上具有显著优势,其包含1000名受试者与21000段视频,远超同类数据集。三种互补模态(RGB、深度、红外)分别提供纹理细节、空间距离与热辐射信息,有效增强对多样化攻击的鉴别能力。数据集划分严谨,包含训练、验证与测试子集,并引入跨模态评估协议,支持算法在不同模态间的泛化性研究。此外,该数据集提供全面的评估指标,包括ROC曲线与错误率统计,为面部防伪技术的实际应用部署提供可靠基准。
使用方法
研究者可通过公开访问链接获取数据集,并依据提供的训练、验证与测试划分开展实验。数据集中每样本均包含三种模态的对齐图像,支持单模态或多模态融合算法的开发。评估时可采用数据集中定义的内部模态协议或跨模态协议,以测试模型在相同或异质模态下的性能。基准方法如多尺度挤压激励融合网络可作为参考,通过特征重加权机制整合多模态信息。该数据集亦适用于预训练任务,可提升模型在Oulu-NPU、SiW等外部数据集上的泛化能力。
背景与挑战
背景概述
随着人脸识别技术在手机解锁、门禁系统和支付验证等日常场景中的广泛应用,其安全性问题日益凸显。面部呈现攻击检测(Face Presentation Attack Detection, PAD)旨在区分真实人脸与伪造攻击(如打印照片、视频重放或3D面具),成为保障系统可靠性的关键技术。在此背景下,中国科学院自动化研究所等机构的研究团队于2018年推出了CASIA-SURF数据集,该数据集聚焦于多模态面部反欺诈研究,旨在解决现有数据集中主体数量有限(≤170)和模态单一(≤2)的瓶颈。CASIA-SURF包含1000名主体的21000段视频,涵盖RGB、深度和红外三种模态,其规模与多样性为面部反欺诈算法的训练与评估提供了重要基础,推动了该领域向大规模、多模态方向的演进。
当前挑战
CASIA-SURF数据集致力于应对面部反欺诈领域的两大核心挑战:一是如何有效区分复杂多变的伪造攻击,例如弯曲或裁剪的打印照片攻击,这些攻击在视觉特征上与真实人脸高度相似,增加了分类难度;二是如何在多模态数据融合中提取互补信息,例如RGB模态提供外观细节,深度模态反映距离特征,红外模态捕捉热辐射差异,但不同模态间的特征对齐与权重分配仍需优化。在数据集构建过程中,团队面临了数据采集与处理的挑战,包括使用Intel RealSense SR300相机同步捕获三模态视频时需确保光照、角度和距离的多样性,以及通过人脸检测、3D重建等预处理步骤消除极端姿态和光照干扰,同时维持数据的规模与质量平衡。此外,数据集中未包含视频重放攻击,因为深度模态对此类攻击的区分过于简单,这限制了数据集的攻击类型覆盖范围,反映了现实应用中攻击手段不断升级所带来的持续挑战。
常用场景
经典使用场景
在生物特征识别领域,人脸防伪检测是确保系统安全性的关键环节。CASIA-SURF数据集凭借其大规模多模态特性,为研究人员提供了一个评估和优化防伪算法的理想平台。该数据集包含1000名受试者的RGB、深度和红外三种模态数据,覆盖了多种打印攻击场景,使得算法能够在复杂多变的条件下进行训练与测试,从而推动防伪技术向更高精度和鲁棒性发展。
实际应用
在实际应用中,CASIA-SURF数据集为金融支付、门禁系统和移动设备解锁等场景的人脸防伪技术提供了关键支持。其多模态数据(RGB、深度、红外)能够模拟真实环境中的光照变化、距离差异和攻击手段,帮助开发出更可靠的防伪系统。例如,深度数据对平面攻击敏感,红外数据可检测热量辐射,这些特性使得基于该数据集的算法在手机人脸支付等高风险应用中表现出更强的安全性和适应性。
衍生相关工作
围绕CASIA-SURF数据集,学术界衍生出多项经典研究工作,主要集中在多模态融合与防伪算法优化方面。例如,基于该数据集提出的多尺度挤压激励融合方法,通过特征重加权机制有效整合了不同模态的互补信息。此外,该数据集常被用作预训练资源,提升如FAS-TD-SF等模型在Oulu-NPU、SiW等公开数据集上的泛化性能,推动了跨数据集和跨攻击类型的防伪技术进展,为后续大规模多模态研究奠定了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作