five

IrisGeneral

收藏
arXiv2024-08-19 更新2024-08-21 收录
下载链接:
http://arxiv.org/abs/2408.09752v1
下载链接
链接失效反馈
官方服务:
资源简介:
IrisGeneral数据集由中国电信研究院等四个机构联合发布,包含10个子集,涵盖7个数据库,使用6种不同设备采集,总计50000条数据。该数据集设计了三种协议,旨在评估虹膜反欺骗模型的平均性能、跨种族泛化能力和跨设备泛化能力。数据集的创建过程涉及多参数集的学习和复杂数据分布的适应,主要应用于高安全性场景中的虹膜识别系统,解决跨域适应问题。

The IrisGeneral dataset was jointly released by four institutions including China Telecom Research Institute. It contains 10 subsets and covers 7 databases, with data collected via 6 distinct devices, totaling 50,000 data samples. Three tailored protocols are designed for this dataset to evaluate the average performance, cross-race generalization capability, and cross-device generalization capability of iris anti-spoofing models. The development of the dataset involves learning with multi-parameter sets and adaptation to complex data distributions. It is primarily applied to iris recognition systems in high-security scenarios to address cross-domain adaptation problems.
提供机构:
中国电信研究院 (CTRI), 中国科学院深圳先进技术研究院 (SIAT), 南方科技大学, 中国科学院自动化研究所 (CASIA), 天津科技大学
创建时间:
2024-08-19
搜集汇总
数据集介绍
main_image_url
构建方式
IrisGeneral数据集的构建方式是通过整合了来自7个数据库的10个子集,这些子集由4个机构收集,使用了6种不同的设备进行采集。数据集的设计包含了三个协议,旨在评估虹膜反欺骗模型的平均性能、跨种族泛化能力和跨设备泛化能力。为了解决整合多个子数据集的挑战,研究人员采用了多个参数集来学习各个子集,并利用混合专家(MoE)方法来适应复杂的数据分布。具体来说,他们使用了多个子神经网络来拟合数据,并引入了一种新颖的方法——Masked-MoE(MMoE),通过随机掩盖部分专家的输入标记,并要求其输出与未掩盖的专家相似,从而提高了模型的泛化能力并有效缓解了MoE方法产生的过拟合问题。
特点
IrisGeneral数据集的特点在于其多样性、跨域性和综合性。数据集包含了来自不同种族和不同设备的虹膜图像,这为评估虹膜反欺骗模型的泛化能力提供了丰富的数据基础。此外,数据集的构建还考虑到了不同设备和种族之间的差异性,设计了三个协议来分别评估模型在平均性能、跨种族泛化和跨设备泛化方面的表现。这使得IrisGeneral数据集成为一个评估虹膜反欺骗模型泛化能力的理想平台。
使用方法
使用IrisGeneral数据集的方法包括以下步骤:首先,需要根据实验目的选择合适的协议,如评估平均性能、跨种族泛化或跨设备泛化。然后,可以使用ResNet50、VIT-B/16、CLIP和FLIP等代表性模型在数据集上进行训练和评估。为了提高模型的泛化能力,可以采用Masked-MoE(MMoE)方法,该方法通过随机掩盖部分输入标记,并要求其输出与未掩盖的专家相似,从而有效缓解了MoE方法产生的过拟合问题。最后,可以通过平均分类错误率(ACER)、总体检测准确率(ACC)、曲线下面积(AUC)和等效错误率(EER)等指标来评估模型的性能。
背景与挑战
背景概述
虹膜识别技术在安全性要求较高的场景中得到了广泛应用,因其独特的稳定性和个体差异性。然而,虹膜图像的采集通常需要近红外照明和近红外波段滤光片,导致不同设备之间的成像存在显著且一致的差异。为了解决虹膜反欺骗方法跨域能力的挑战,研究人员提出了IrisGeneral数据集。该数据集由四家机构发布,包含了来自六个不同类型设备的七个数据库的十个子集。IrisGeneral数据集旨在评估虹膜反欺骗模型的平均性能、跨种族泛化能力和跨设备泛化能力。为了应对集成多个子数据集的挑战,研究人员采用了多个参数集来从各个子集中学习。具体来说,他们利用了混合专家(MoE)方法来拟合复杂的数据分布,并提出了Masked-MoE(MMoE)方法来进一步增强模型的泛化能力。实验结果表明,使用CLIP的MMoE在IrisGeneral数据集上取得了最佳性能。
当前挑战
IrisGeneral数据集和相关研究面临的主要挑战包括:1) 虹膜反欺骗任务的跨域泛化能力评估,由于不同设备采集的虹膜图像存在差异,因此模型需要在多种设备上进行训练和评估;2) 构建过程中遇到的挑战,包括如何有效地集成多个子数据集,以及如何解决MoE方法可能带来的过拟合问题。为了应对这些挑战,研究人员提出了MMoE方法,其中Mask Mechanism用于缓解过拟合问题,而Cosine Distance Loss则进一步提高了模型的泛化能力。
常用场景
经典使用场景
IrisGeneral数据集主要用于评估虹膜反欺骗模型的跨域泛化能力,特别是在跨种族和跨设备的情况下。它包含了10个子集,来自7个数据库,由4个机构收集,使用了6种不同类型的设备。这些子集被设计成三种协议,以评估虹膜反欺骗模型的平均性能、跨种族泛化能力和跨设备泛化能力。
衍生相关工作
IrisGeneral数据集的提出衍生了一系列相关工作,包括使用Masked-MoE方法来提高模型的泛化能力和缓解过拟合问题。这些工作为虹膜反欺骗技术的发展提供了新的思路和方法,有望在未来得到更广泛的应用。
数据集最近研究
最新研究方向
在虹膜识别领域,虹膜图像的采集通常需要近红外照明和近红外波段滤镜,导致不同设备之间的成像存在显著且一致的差异。为了提高虹膜反欺骗方法的跨域能力,研究者们提出了IrisGeneral数据集。该数据集包含了来自不同数据库和机构的10个子集,涵盖了6种类型的设备采集的虹膜图像。IrisGeneral数据集旨在评估虹膜反欺骗模型的平均性能、跨种族泛化能力和跨设备泛化能力。为了解决集成多个子数据集的挑战,研究者们采用了多种参数集,并利用混合专家(MoE)模型来拟合复杂的数据分布。此外,为了进一步提高泛化能力,研究者们还提出了一个名为Masked-MoE(MMoE)的新方法。MMoE通过随机遮蔽部分专家的输入标记,并要求它们的输出与未遮蔽专家的输出相似,从而提高了泛化能力并有效地缓解了MoE模型可能出现的过拟合问题。实验结果表明,在IrisGeneral数据集上,MMoE与CLIP模型结合使用取得了最佳的性能。这些研究成果为虹膜反欺骗领域的研究提供了新的思路和方法,有助于提高虹膜识别系统的安全性和可靠性。
相关研究论文
  • 1
    A Unified Framework for Iris Anti-Spoofing: Introducing IrisGeneral Dataset and Masked-MoE Method中国电信研究院 (CTRI), 中国科学院深圳先进技术研究院 (SIAT), 南方科技大学, 中国科学院自动化研究所 (CASIA), 天津科技大学 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作