IrisGeneral

Name: IrisGeneral
Creator: 中国电信研究院 (CTRI), 中国科学院深圳先进技术研究院 (SIAT), 南方科技大学, 中国科学院自动化研究所 (CASIA), 天津科技大学
Published: 2024-08-19 15:24:36
License: 暂无描述

arXiv2024-08-19 更新2024-08-21 收录

下载链接：

http://arxiv.org/abs/2408.09752v1

下载链接

链接失效反馈

官方服务：

资源简介：

IrisGeneral数据集由中国电信研究院等四个机构联合发布，包含10个子集，涵盖7个数据库，使用6种不同设备采集，总计50000条数据。该数据集设计了三种协议，旨在评估虹膜反欺骗模型的平均性能、跨种族泛化能力和跨设备泛化能力。数据集的创建过程涉及多参数集的学习和复杂数据分布的适应，主要应用于高安全性场景中的虹膜识别系统，解决跨域适应问题。

The IrisGeneral dataset was jointly released by four institutions including China Telecom Research Institute. It contains 10 subsets and covers 7 databases, with data collected via 6 distinct devices, totaling 50,000 data samples. Three tailored protocols are designed for this dataset to evaluate the average performance, cross-race generalization capability, and cross-device generalization capability of iris anti-spoofing models. The development of the dataset involves learning with multi-parameter sets and adaptation to complex data distributions. It is primarily applied to iris recognition systems in high-security scenarios to address cross-domain adaptation problems.

提供机构：

中国电信研究院 (CTRI), 中国科学院深圳先进技术研究院 (SIAT), 南方科技大学, 中国科学院自动化研究所 (CASIA), 天津科技大学

创建时间：

2024-08-19

搜集汇总

数据集介绍

构建方式

IrisGeneral数据集的构建方式是通过整合了来自7个数据库的10个子集，这些子集由4个机构收集，使用了6种不同的设备进行采集。数据集的设计包含了三个协议，旨在评估虹膜反欺骗模型的平均性能、跨种族泛化能力和跨设备泛化能力。为了解决整合多个子数据集的挑战，研究人员采用了多个参数集来学习各个子集，并利用混合专家（MoE）方法来适应复杂的数据分布。具体来说，他们使用了多个子神经网络来拟合数据，并引入了一种新颖的方法——Masked-MoE（MMoE），通过随机掩盖部分专家的输入标记，并要求其输出与未掩盖的专家相似，从而提高了模型的泛化能力并有效缓解了MoE方法产生的过拟合问题。

特点

IrisGeneral数据集的特点在于其多样性、跨域性和综合性。数据集包含了来自不同种族和不同设备的虹膜图像，这为评估虹膜反欺骗模型的泛化能力提供了丰富的数据基础。此外，数据集的构建还考虑到了不同设备和种族之间的差异性，设计了三个协议来分别评估模型在平均性能、跨种族泛化和跨设备泛化方面的表现。这使得IrisGeneral数据集成为一个评估虹膜反欺骗模型泛化能力的理想平台。

使用方法

使用IrisGeneral数据集的方法包括以下步骤：首先，需要根据实验目的选择合适的协议，如评估平均性能、跨种族泛化或跨设备泛化。然后，可以使用ResNet50、VIT-B/16、CLIP和FLIP等代表性模型在数据集上进行训练和评估。为了提高模型的泛化能力，可以采用Masked-MoE（MMoE）方法，该方法通过随机掩盖部分输入标记，并要求其输出与未掩盖的专家相似，从而有效缓解了MoE方法产生的过拟合问题。最后，可以通过平均分类错误率（ACER）、总体检测准确率（ACC）、曲线下面积（AUC）和等效错误率（EER）等指标来评估模型的性能。

背景与挑战

背景概述

虹膜识别技术在安全性要求较高的场景中得到了广泛应用，因其独特的稳定性和个体差异性。然而，虹膜图像的采集通常需要近红外照明和近红外波段滤光片，导致不同设备之间的成像存在显著且一致的差异。为了解决虹膜反欺骗方法跨域能力的挑战，研究人员提出了IrisGeneral数据集。该数据集由四家机构发布，包含了来自六个不同类型设备的七个数据库的十个子集。IrisGeneral数据集旨在评估虹膜反欺骗模型的平均性能、跨种族泛化能力和跨设备泛化能力。为了应对集成多个子数据集的挑战，研究人员采用了多个参数集来从各个子集中学习。具体来说，他们利用了混合专家（MoE）方法来拟合复杂的数据分布，并提出了Masked-MoE（MMoE）方法来进一步增强模型的泛化能力。实验结果表明，使用CLIP的MMoE在IrisGeneral数据集上取得了最佳性能。

当前挑战

IrisGeneral数据集和相关研究面临的主要挑战包括：1) 虹膜反欺骗任务的跨域泛化能力评估，由于不同设备采集的虹膜图像存在差异，因此模型需要在多种设备上进行训练和评估；2) 构建过程中遇到的挑战，包括如何有效地集成多个子数据集，以及如何解决MoE方法可能带来的过拟合问题。为了应对这些挑战，研究人员提出了MMoE方法，其中Mask Mechanism用于缓解过拟合问题，而Cosine Distance Loss则进一步提高了模型的泛化能力。

常用场景

经典使用场景

IrisGeneral数据集主要用于评估虹膜反欺骗模型的跨域泛化能力，特别是在跨种族和跨设备的情况下。它包含了10个子集，来自7个数据库，由4个机构收集，使用了6种不同类型的设备。这些子集被设计成三种协议，以评估虹膜反欺骗模型的平均性能、跨种族泛化能力和跨设备泛化能力。

衍生相关工作

IrisGeneral数据集的提出衍生了一系列相关工作，包括使用Masked-MoE方法来提高模型的泛化能力和缓解过拟合问题。这些工作为虹膜反欺骗技术的发展提供了新的思路和方法，有望在未来得到更广泛的应用。

数据集最近研究