DEVCOM陆军研究实验室可见光-热红外面部数据集 (ARL-VTF)

Name: DEVCOM陆军研究实验室可见光-热红外面部数据集 (ARL-VTF)
Creator: 西弗吉尼亚大学
Published: 2021-01-08 01:17:12
License: 暂无描述

arXiv2021-01-08 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2101.02637v1

下载链接

链接失效反馈

官方服务：

资源简介：

DEVCOM陆军研究实验室可见光-热红外面部数据集(ARL-VTF)是目前已知最大的配对可见光和热红外面部图像集合，包含超过500,000张来自395个不同个体的图像。该数据集使用现代长波红外(LWIR)相机与三个可见光谱相机的立体设置同步捕捉，记录了表情、姿态和眼镜佩戴的系统变化。数据集经过精心注释，包含丰富的元数据和标准化评估协议。主要用于军事、执法和医疗领域的面部识别研究，特别是在低光和夜间环境中，以及在挑战性的无约束操作条件下。

The DEVCOM Army Research Laboratory Visible-Thermal Facial Dataset (ARL-VTF) is the largest known collection of paired visible and thermal infrared facial images to date, containing over 500,000 images from 395 distinct individuals. This dataset was synchronously captured using a modern long-wave infrared (LWIR) camera and a stereo setup of three visible-spectrum cameras, recording systematic variations in facial expressions, poses, and eyeglass wear. The dataset has been meticulously annotated, with rich metadata and standardized evaluation protocols. It is primarily used for facial recognition research in military, law enforcement, and medical fields, especially in low-light and nighttime environments, as well as under challenging unconstrained operational conditions.

提供机构：

西弗吉尼亚大学

创建时间：

2021-01-08

搜集汇总

数据集介绍

构建方式

在红外热成像技术日益成为军事、执法及医疗领域关键工具的背景下，ARL-VTF数据集的构建旨在填补高分辨率热红外人脸图像资源的空白。该数据集通过精心设计的传感器阵列进行采集，阵列包含三台可见光相机（两台FLIR Grasshopper3单色相机和一台Basler Scout彩色相机）与一台FLIR Boson长波红外热像仪，所有设备均安装于同一光学平板上以实现空间对齐。数据采集过程中，395名受试者在标准化光照环境下，以2.1米固定距离面对传感器，依次完成基线（中性表情）、表达（计数说话）、姿态（头部旋转）及眼镜佩戴（如适用）四种序列的录制，每个序列持续约10秒。传感器通过多线程软件触发实现15帧/秒的时间同步采集，并利用定制化的可见光与热红外标定板进行每日校准，确保多模态图像在二维配准与三维几何上的精确对齐。

特点

ARL-VTF数据集的核心特点在于其规模与多模态同步性。作为当前最大的配对可见光-热红外人脸图像集合，它涵盖超过50万张图像，所有数据均来自395名受试者，且每帧可见光与热红外图像均严格时间同步。数据集系统性地引入了表情、姿态及眼镜佩戴等多种变量，增强了其在真实场景下的代表性。此外，数据集提供了丰富的标注信息，包括人脸边界框、6点面部关键点坐标、头部姿态估计偏航角以及眼镜佩戴状态元数据。这些标注通过商用检测算法结合人工校正生成，并利用立体相机几何投影至各传感器坐标空间，确保了跨模态的一致性。数据集的划分遵循主体不相交原则，设有开发集（含训练与验证子集）与测试集，并附有标准化的热红外-可见光人脸验证协议，为算法评估提供了可靠基准。

使用方法

该数据集主要应用于跨模态人脸识别、热红外人脸关键点检测及图像合成等研究方向。在使用时，研究者可依据提供的协议文件，将数据划分为训练、验证与测试集，其中测试集已按等量采样原则平衡了各序列的图像数量。对于热红外-可见光人脸验证任务，数据集定义了明确的画廊与探针集构建规则，例如画廊仅包含可见光基线图像，而探针则涵盖热红外的基线、表情及姿态序列图像。开发者可利用附带的标注（如关键点、边界框）进行模型训练，并通过提供的相机内参与外参实现跨模态的几何对齐或三维重建。数据集的标准化协议支持多种先进算法（如生成对抗网络、域自适应方法）的基准测试，用户需通过联系指定邮箱签署数据使用协议后获取数据，确保其用于合规的科学研究。

背景与挑战

背景概述

热成像技术在军事、执法与医疗领域的应用日益广泛，尤其在低光照或夜间环境下的人脸识别任务中展现出独特优势。然而，热红外人脸数据长期以来面临稀缺问题，现有数据集往往受限于图像分辨率低、样本规模小或缺乏同步多模态数据。为应对这一挑战，美国陆军研究实验室（DEVCOM ARL）联合西弗吉尼亚大学、约翰斯·霍普金斯大学等机构，于2019年11月共同构建了ARL-VTF数据集。该数据集收录了395名受试者的超过50万张图像，通过可见光与长波红外（LWIR）相机的同步采集，系统记录了表情、姿态及眼镜佩戴等变量，成为迄今规模最大的配对可见光-热红外人脸数据集。其高分辨率热成像与精细标注为跨模态人脸验证、特征融合及域适应算法研究提供了关键支撑，显著推动了红外视觉领域的发展。

当前挑战

ARL-VTF数据集致力于解决热红外人脸识别中的跨模态匹配难题，尤其在复杂条件下实现热成像至可见光图像的准确映射。该领域核心挑战在于热成像与可见光图像间的域差异，如纹理细节缺失、热辐射特性受环境与遮挡影响等，导致传统识别模型性能受限。数据构建过程中，研究团队需克服多传感器时间同步、空间标定及大规模数据标注的复杂性；同时，为涵盖真实场景变异，需精心设计采集协议以覆盖头部姿态、表情变化及眼镜佩戴等条件，确保数据多样性与一致性。此外，热成像中眼镜镜片的热吸收效应会形成遮挡，进一步增加了跨模态匹配的算法开发难度。

常用场景

经典使用场景

在计算机视觉与生物识别领域，多模态人脸识别研究常面临可见光与热红外图像数据稀缺的挑战。ARL-VTF数据集以其大规模、时间同步的可见光与热红外人脸图像对，为跨模态人脸验证任务提供了经典实验平台。该数据集通过系统采集基线、表情和姿态序列，支持算法在复杂条件下评估热红外至可见光的人脸匹配性能，成为推动异构人脸识别技术发展的核心资源。

实际应用

该数据集在军事安防、执法监控及医疗健康等领域具有重要应用价值。例如，在低光照或夜间环境中，热成像设备可捕获人脸自然散发的热量，ARL-VTF支持开发能够在恶劣操作条件下实现可靠身份验证的系统。其多模态特性亦有助于推动跨光谱人脸识别技术在现实场景中的部署，增强安防系统的全天候工作能力。

衍生相关工作

基于ARL-VTF数据集，多项经典研究工作得以推进，例如采用生成对抗网络（GAN）进行热红外至可见光的人脸图像合成，如Pix2Pix、GANVFS和自注意力CycleGAN等方法。同时，域自适应特征学习框架如Fondje等人提出的模型，也在该数据集上实现了高效的跨模态验证。这些工作共同推动了多模态人脸分析算法在理论与应用层面的深化。

以上内容由遇见数据集搜集并总结生成