liveness-detection-dataset
收藏Hugging Face2026-05-07 更新2026-05-08 收录
下载链接:
https://huggingface.co/datasets/AxonData/liveness-detection-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个全面的面部活体检测数据集,专为面部反欺骗、生物识别面部识别和呈现攻击检测(PAD)系统设计。与仅覆盖一两种攻击类型的公共基准不同,该数据集集成了所有主要的呈现攻击类别,包括纸质攻击、重放攻击和3D面具攻击(硅胶、乳胶、纸包、树脂、布料),提供了超过10万条视频,涵盖11种以上标记的攻击类型,并映射到iBeta Level 1、Level 2和Level 3 PAD认证。数据集包含真实面部(bona fide)和多种攻击类型的视频序列,每种攻击类型均标有其iBeta级别。数据采集使用了现代智能手机(如iPhone 14/13 Pro、Galaxy S23、Pixel 7等),覆盖室内外环境、多种光照条件和平衡的人口统计特征(包括高加索人、黑人、亚洲人和拉丁裔)。适用于训练二元反欺骗分类器、多类攻击类型分类器、iBeta认证准备以及跨攻击泛化研究。
创建时间:
2026-05-01
搜集汇总
数据集介绍

构建方式
该数据集的构建立足于现代生物识别安全领域对防活体攻击检测的迫切需求,汇集了超过10万段视频样本,系统性地覆盖了从基础的纸质照片攻击、视频回放攻击到高级的3D面具攻击(包括硅胶、乳胶、树脂、布料等材质)等11种以上攻击类型。所有数据均由当前主流智能手机(如iPhone 14、三星Galaxy S23等)在室内外真实环境中采集,并按照iBeta L1至L3认证标准对每种攻击类型进行了精确标注,从而为活体检测模型的训练提供了高度专业化的素材。
特点
数据集的核心优势在于其全面性与实用性兼具。它将绝大数主流的攻击向量整合于一处,大幅降低了科研人员或企业拼接多个独立基准数据集(如CASIA-FASD、Replay-Attack等)的复杂度。此外,数据采集使用了现代智能手机设备,确保了图像质量与生产环境对齐;同时兼顾了不同性别与族裔的均衡表征,并包含固定、缩放等多种活体检测阶段,使得训练出的模型具备更强的泛化能力与抗攻击韧性。
使用方法
该数据集支持多种应用路径。研究者可以直接将其用于训练二分类活体检测模型(区分真实人脸与所有攻击类型),或构建多类别攻击分类器以实现可解释性人工智能诊断。对于需要获取iBeta认证的团队,可按标签筛选出对应等级的攻击数据(如L1级攻击),进行针对性的模型训练与基准测试。此外,该数据集还可用于跨攻击类型泛化能力研究,通过分析模型在不同攻击类别(如打印攻击与3D面具攻击)间的性能差异,优化算法鲁棒性。
背景与挑战
背景概述
该数据集由Axon Labs于近期发布,旨在解决面部活体检测领域长期存在的攻击类型覆盖不足与认证标准衔接不紧密的核心研究问题。不同于以往仅涵盖一两种攻击模式的学术基准,如CASIA-FASD或Replay-Attack,此数据集系统整合了11种以上的呈现攻击类型,包括纸质打印、视频重放、硅胶面具与树脂面具等,并直接映射至iBeta Level 1至Level 3的防欺骗认证标准。其构建采用iPhone 14、Galaxy S23等现代智能手机,在室内外多种光照条件下采集,确保了数据在真实生产环境中的代表性。该资源对于推动金融科技身份验证、政府生物识别等应用中的防欺骗技术发展具有重要影响。
当前挑战
面部活体检测领域面临的核心挑战在于攻击手段的不断演进与泛化性难题:从简单的2D打印照片到高保真3D面具,攻击方式日趋复杂,传统针对单一攻击类型训练的模型难以有效应对未知变种。数据构建过程中亦存在显著障碍,包括不同攻击样本的获取难度与成本差异,例如树脂面具与硅胶面具的定制化生产费用高昂;同时需保证采集设备、环境光照及人口统计特征的多样性,以避免模型产生偏见。此外,数据集需严格遵循iBeta等认证标准标注,确保训练结果可直接用于合规性评估,这进一步提升了数据准备与质量控制的复杂性。
常用场景
经典使用场景
该数据集广泛应用于面部活体检测与反欺骗系统的训练与评估,尤其聚焦于人脸识别场景下的呈现攻击检测。研究者可利用超过10万条多样化的攻击视频,涵盖纸质打印、屏幕回放、硅胶面具、乳胶面具、树脂面具等多种攻击类型,构建二元活体分类模型或多类别攻击类型识别模型。数据集内嵌了iBeta L1至L3认证等级标签,为模型在不同安全等级下的性能评估提供了标准化依据。同时,该数据集支持跨攻击泛化研究,帮助分析系统在面对新型或未见攻击类型时的鲁棒性。
衍生相关工作
该数据集催生了一系列专注于特定攻击类型的子数据集,包括硅胶面具、3D纸质面具、高级纸质攻击、照片打印攻击以及显示器回放攻击等,为细粒度攻击分析与针对性防御模型开发提供了资源基础。同时,基于本数据集衍生的iBeta L1、L2、L3认证数据集,为研究者提供了标准化的认证级训练与测试平台。这些衍生工作不仅拓展了活体检测的研究边界,还推动了跨数据集泛化方法、可解释性攻击类型分类以及多模态融合技术在反欺骗领域的探索。
数据集最近研究
最新研究方向
在生物特征识别与身份验证的前沿领域,活体检测数据集(liveness-detection-dataset)正成为应对日益复杂的人脸呈现攻击的关键资源。随着eKYC、金融科技和数字身份认证的广泛部署,攻击手段已从传统的打印照片、视频重放,演进至高度逼真的硅胶、树脂及3D纸面具,甚至涵盖深伪检测的挑战。该数据集集成了逾十万段涵盖11种以上攻击类型的视频样本,突破性地将iBeta Level 1至Level 3的认证标准直接映射至训练标签,极大地简化了从学术研究到生产级认证的迁移路径。其采用最新一代智能手机采集数据,并兼顾多元种族与光照环境,为跨攻击泛化性研究、多分类解释性AI模型开发以及反欺骗算法的鲁棒性评估提供了高保真的实验基底。这一资源的推出,不仅弥补了既有公开基准如CASIA-FASD或OULU-NPU在攻击维度与场景多样性上的局限,更推动了活体检测技术向实用化、标准化与合规化方向的实质性演进。
以上内容由遇见数据集搜集并总结生成



