five

ONOT

收藏
arXiv2024-04-17 更新2024-06-21 收录
下载链接:
https://miatbiolab.csr.unibo.it/icao-synthetic-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
ONOT数据集是由意大利博洛尼亚大学计算机科学与工程系创建的高质量合成面部图像数据集,专为满足ISO/ICAO标准而设计。该数据集包含96万张图像,涵盖多种性别、种族、年龄和面部特征,用于支持电子机读旅行证件(eMRTD)中的面部图像分析研究。数据集的创建过程严格控制,确保图像质量符合国际民航组织(ICAO)的指导原则。ONOT数据集主要应用于面部图像质量评估和形态攻击检测等领域,旨在解决隐私保护和偏见问题,推动公平的面部识别技术发展。

The ONOT Dataset is a high-quality synthetic facial image dataset created by the Department of Computer Science and Engineering, University of Bologna, Italy, specifically designed to comply with ISO/ICAO standards. It contains 960,000 images covering diverse genders, ethnicities, ages and facial features, and is used to support research on facial image analysis in electronic machine-readable travel documents (eMRTD). The dataset was developed under strict quality control to ensure its images meet the guidelines of the International Civil Aviation Organization (ICAO). The ONOT Dataset is mainly applied in fields such as facial image quality assessment and presentation attack detection, aiming to address privacy protection and bias issues and promote the development of equitable facial recognition technology.
提供机构:
博洛尼亚大学计算机科学与工程系
创建时间:
2024-04-17
搜集汇总
数据集介绍
main_image_url
构建方式
在合成人脸数据集的构建领域,ONOT数据集采用了一种严谨的多阶段生成与筛选流程。该流程以精心设计的提示模板为基础,利用微调后的Stable Diffusion模型生成初始图像,确保生成的面部具有高度的真实感。随后,通过商业SDK对每张图像进行严格的ISO/IEC 39794-5标准符合性验证,筛选出满足电子机读旅行证件(eMRTD)质量要求的图像。为确保身份一致性,研究团队进一步应用了人脸识别管道,通过计算嵌入向量的余弦距离,分别实施了类内一致性验证与类间一致性验证,最终构建出身份独特且内部一致的图像集合。
特点
ONOT数据集的核心特征在于其严格遵循国际民航组织(ICAO)指南与ISO/IEC 39794-5标准,生成了高质量、标准化的正面人脸图像。该数据集包含了丰富的人口统计学多样性,涵盖了不同的性别、年龄、种族以及面部特征(如雀斑、眼镜等),旨在缓解传统数据集中存在的偏见问题。此外,数据集不仅提供了符合标准的数字图像,还模拟了证件签发过程中常见的打印扫描(P&S)操作,生成了相应的衍生版本,增强了其在真实场景下的适用性。数据集的高度可复现性与可扩展性,得益于其公开的生成提示、模型细节及筛选程序文档。
使用方法
ONOT数据集主要应用于与电子身份文档分析相关的计算机视觉研究领域,特别是面部变形攻击检测(Morphing Attack Detection)和面部图像质量评估(Face Quality Assessment)任务。研究人员可利用其标准化的正面人脸图像,开发或评估相关算法的性能。数据集提供了基于不同相似度阈值划分的多个子集,分别对应不同的研究场景:低阈值子集包含更多外貌相似的个体,适用于挑战性的身份区分任务;而高阈值子集则身份差异更明显,但类内变化更大,适用于提升人脸识别系统对表观变化的鲁棒性。用户可根据具体研究目标,选择相应的图像子集及配套的打印扫描版本进行实验。
背景与挑战
背景概述
在人工智能技术迅猛发展的时代背景下,人脸识别系统在安全认证与身份核验领域扮演着日益重要的角色。然而,基于真实人脸图像构建的数据集常伴随隐私泄露与人口统计学偏见等伦理挑战。为此,博洛尼亚大学计算机科学与工程系的Nicolò Di Domenico、Guido Borghi、Annalisa Franco与Davide Maltoni研究团队于2024年提出了ONOT数据集。该数据集以生成式人工智能技术为核心,严格遵循国际民航组织(ICAO)指南及ISO/IEC 39794-5标准,旨在合成高质量、符合电子机读旅行证件规范的人脸图像。其核心研究目标在于为变形攻击检测与人脸质量评估等任务提供标准化、无隐私风险的基准数据,推动生物特征识别技术在合规性与公平性方向的演进。
当前挑战
ONOT数据集致力于解决电子旅行证件场景下人脸图像分析的标准化难题,其核心挑战在于生成既符合严格国际标准又保持身份多样性的合成数据。具体而言,构建过程中面临多重技术瓶颈:其一,生成模型需在保持人脸高度真实感的同时,精确控制光照均匀性、面部阴影、饱和度等摄影学参数以满足ISO/ICAO合规性检测;其二,身份一致性维护极为困难,初始生成的数万伪类别经过去重与合规筛选后仅留存少量独立身份,揭示匿名身份生成的固有复杂性;其三,商业合规检测工具的黑盒特性导致生成参数调试缺乏明确反馈,加剧了高质量图像生成的工程难度。这些挑战共同指向合成数据在标准化生物特征应用中的精度与可控性边界。
常用场景
经典使用场景
在生物特征识别与文档安全领域,ONOT数据集为研究电子机读旅行证件(eMRTD)中的人脸图像分析提供了标准化基准。该数据集严格遵循国际民航组织(ICAO)与ISO/IEC 39794-5标准,生成的高质量合成人像具备中性表情、均匀光照与背景等规范特征,使其成为评估人脸质量、验证标准合规性的理想实验平台。研究人员可借助该数据集,在受控条件下系统性地探索标准证件照的视觉特性与算法适应性。
实际应用
在实际应用中,ONOT数据集直接服务于护照、身份证等电子旅行证件的签发与核验流程。其生成的ICAO合规图像可用于训练和测试人脸质量评估系统,确保证件照满足国际标准的技术要求。此外,该数据集在面部形态攻击检测领域具有重要价值,能够为开发防御证件照片篡改与合成欺诈的技术方案提供丰富的正负样本,从而增强边境安检与身份认证系统的安全性与可靠性。
衍生相关工作
ONOT数据集的发布推动了多个相关研究方向的进展。在形态攻击检测领域,其高质量的合成正样本为构建更复杂的混合攻击数据集奠定了基础。在人脸质量评估方面,它催生了针对标准合规性进行细粒度评分的算法研究。同时,该数据集生成框架所体现的“提示工程-标准验证-身份一致性检查”流程,也为后续合成数据生成研究提供了可复现的方法论参考,激励了更多面向特定标准与场景的合成数据创建工作。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作