five

AxonData/liveness-detection-dataset

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/AxonData/liveness-detection-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
一个包含10万多个欺骗视频的活体检测数据集,专为训练和评估人脸防伪模型而设计。与仅涵盖一两种攻击类型的狭窄公共数据集不同,该数据集在一个资源中结合了所有主要的呈现攻击类别,包括纸质攻击、重放攻击、3D面具(硅胶、乳胶、纸包裹、树脂)等。每个视频/图像序列都标有攻击类型和类别,如真实、印刷照片、3D纸质面具、纸包裹3D、圆柱纸质面具等。数据集适用于训练二元或多元攻击类型分类器,以及准备iBeta认证。

100,000+ spoofing videos for liveness detection. A general-purpose liveness detection dataset designed for training and evaluating face anti-spoofing models. Unlike narrow public datasets that cover only one or two attack types, this dataset combines all major presentation attack categories in a single resource — paper attacks, replay attacks, 3D masks (silicone, latex, paper-wrapped, resin), and more. Each video/image sequence is labeled with one of the attack types and categories, such as live, photo_print, 3d_paper_mask, wrapped_3d_print, cylinder_3d_mask, etc. The dataset is suitable for training binary or multi-class attack-type classifiers and preparing for iBeta certification.
提供机构:
AxonData
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由Axon Labs构建,旨在为面部活体检测任务提供全面的训练与评估资源。其构建过程涵盖了11种以上的攻击类型,包括纸质打印攻击、重放攻击(手机屏幕与显示器)、以及多种3D面具攻击(如硅胶、乳胶、树脂和纸质包裹面具等)。所有样本均通过现代智能手机(如iPhone 14/13 Pro、Galaxy S23、Pixel 7、Redmi、Honor 70等)在室内外真实场景中采集而成,并注重性别与种族的均衡分布。每个视频样本均被标注为真实活体或具体的攻击类别,从而形成一个兼具广度和深度的数据集。
特点
该数据集的核心特点在于其全面性与实战导向。它整合了iBeta Level 1至Level 3的多种攻击类型,覆盖从二维照片到高保真三维面具的完整攻击谱系。超10万个视频样本确保了数据的规模优势,而多样化的采集设备和环境则提升了模型的泛化能力。此外,数据集严格遵循iBeta认证协议,使得研究者能够直接针对APCER和BPCER等关键指标进行模型调优,从而缩短从研发到认证的周期。
使用方法
该数据集支持多种使用模式。在二元分类任务中,可将所有攻击样本合并为“非活体”类,训练基础的活体检测模型。进阶用法是将其用于多分类任务,区分具体的攻击类型,这有助于构建可解释的AI系统或进行模型错误分析。针对iBeta认证准备,研究者可按攻击类别分层筛选样本,独立训练和验证各层级(L1/L2/L3)的模型性能。数据集以单视频或图像序列形式提供,可直接接入常见的深度学习框架进行模型训练与评估。
背景与挑战
背景概述
在生物识别安全领域,人脸活体检测技术是抵御呈现攻击(如照片、视频回放及3D面具)的关键防线。然而,早期公开数据集(如CASIA-FASD、Replay-Attack等)因攻击类型单一、采集设备老旧,难以支撑现代高安全性系统的需求。由Axon Labs团队构建的Liveness Detection Dataset应运而生,该数据集于近年发布,包含超过10万段视频,覆盖11种以上攻击类型(包括硅胶面具、树脂高仿面具等iBeta L1至L3级别攻击),并采用iPhone 14 Pro、Galaxy S23等当前主流设备在室内外多样环境下采集,兼顾性别与种族平衡。其核心研究问题在于提供一个通用性、规模化的训练与评估基准,以推动人脸反欺骗模型从实验室走向产品级部署,目前已为21%的iBeta认证生物识别公司所信赖,显著提升了领域研究的可复现性与模型泛化能力。
当前挑战
该数据集所面临的挑战集中在两大层面。在领域问题层面,传统活体检测方法难以抵御多样化且不断演变的呈现攻击,尤其是高逼真度的3D面具(如树脂、硅胶材质)和复杂回放场景,导致模型在真实部署中误判率居高不下;现有公开数据集因攻击类型有限、采集环境单一,无法覆盖iBeta认证所需的严格测试协议,制约了行业安全标准的提升。在数据构建层面,确保100,000+视频中每类攻击(如纸面具与皮肤打印)的精确标注需大量人工审核,同时模拟真实世界中的光线、角度及设备差异以保持数据多样性,还需解决大规模采集时的隐私合规与硬件成本问题,这些均构成了构建该数据集的核心技术挑战。
常用场景
经典使用场景
在生物特征识别与计算机视觉的交叉领域中,活体检测数据集(Liveness Detection Dataset)最为经典的应用场景便是训练和评估人脸反欺骗模型。该数据集囊括了超过100,000段涵盖打印照片、屏幕重放、硅胶面具、乳胶头套及高保真树脂面具等十余种主要呈现攻击类型的视频样本,为从二分类的活体与非活体判别到多分类的特定攻击类型识别提供了坚实的数据基础。研究者可依据iBeta L1至L3认证标准对数据进行分层筛选,从而模拟真实世界的攻击威胁谱系,构建鲁棒且可解释的活体检测系统。
解决学术问题
该数据集精准回应了人脸反欺骗领域中长期存在的两大核心学术挑战:攻击类型覆盖的碎片化与模型泛化能力的不足。此前学界依赖CASIA-FASD、Replay-Attack等各自聚焦单一或少数攻击类型的孤立数据集,难以系统评估模型面对多样化攻击时的退化行为。通过将纸质攻击、回放攻击、三维面具攻击等关键呈现攻击类别整合于统一框架,该数据集使得研究者能够在一致的评价协议下量化模型对不同攻击模态的响应差异,并深入探索跨攻击类型、跨设备及跨环境下的迁移学习与领域自适应问题,为人脸安全认证系统的理论突破提供了可复现的规模化实验平台。
衍生相关工作
围绕该数据集衍生的经典工作主要集中于可解释人工智能与自适应防御机制两个方向。一方面,多分类攻击标签的细粒度特性催生了一系列关于解释性活体检测的研究,旨在不仅判断人脸真伪,还能明确揭示攻击的具体类型(如“硅胶面具攻击”或“屏幕重放攻击”),从而辅助系统运维人员定位安全漏洞。另一方面,该数据集所涵盖的广泛攻击类别为领域对抗训练、元学习以及面向未知攻击的零样本/少样本泛化方法提供了理想的评测基准,推动了如基于特征解耦的攻击无关表示学习等前沿范式的出现,为人脸反欺骗领域注入了新的理论活力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作