VGGFace2

arXiv2018-05-13 更新2024-08-06 收录

下载链接：

https://academictorrents.com/details/535113b8395832f09121bc53ac85d7bc8ef6fa5b

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含331万张9131个主题的图像，每个主题平均有362.6张图像。图像来自Google Image Search，具有姿态、年龄、光照、种族和职业（如演员、运动员、政治家）的大量变化。数据集的收集旨在拥有大量身份和每个身份的大量图像，覆盖广泛的姿态、年龄和种族，并最小化标签噪声。

This dataset contains 3.31 million images spanning 9,131 distinct topics, with an average of 362.6 images per topic. All images are sourced from Google Image Search and exhibit extensive variations in pose, age, lighting, race, and occupation (e.g., actors, athletes, politicians). The dataset was collected with the objectives of including a large number of distinct identities with ample images per identity, covering a wide range of poses, ages and racial backgrounds, and minimizing label noise.

创建时间：

2017-10-23

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，人脸识别技术对高质量数据集的需求日益迫切。VGGFace2的构建过程体现了系统化与精细化的设计理念。该数据集从Freebase知识图谱中筛选出约50万个公众人物作为初始候选名单，通过人工审核保留图像一致性较高的身份，最终确定9244个身份。利用谷歌图像搜索，为每个身份下载包含不同姿态与年龄变化的图像，总计约1294万张原始图像。随后采用多阶段过滤流程：首先使用MTCNN模型进行人脸检测与关键点定位；接着通过基于VGGFace特征的分类器自动剔除异常人脸；再运用VLAD描述子聚类去除近似重复图像；最后结合自动分类与人工审核，清除身份重叠及异常图像，确保标签纯净度高于96%。整个流程历时数月，最终形成包含9131个身份、331万张图像的高质量数据集。

特点

VGGFace2数据集在规模与多样性方面具有显著优势。该数据集涵盖9131个身份，总计331万张图像，平均每个身份拥有362.6张图像，在身份数量与个体图像数量之间实现了平衡。图像采集自网络环境，呈现出丰富的姿态变化，涵盖正面、侧面及中间角度；年龄跨度广泛，包含从幼年至成熟期的面容变化；同时覆盖多种光照条件、不同种族背景及职业类别。数据集提供了人脸边界框、五个关键特征点坐标，以及通过预训练模型估计的姿态角度与表观年龄信息。特别地，其评估集包含针对姿态与年龄匹配任务设计的模板标注，为研究跨姿态与跨年龄的人脸识别提供了结构化测试基准。

使用方法

VGGFace2数据集主要用于训练与评估深度人脸识别模型。研究者可将数据集划分为训练集与测试集，其中训练集包含8631个身份，测试集包含500个身份。在模型训练阶段，可利用该数据集的大规模图像训练卷积神经网络，如ResNet-50或SE-ResNet-50，通过softmax损失函数进行身份分类学习。训练时可采用数据增强策略，如随机裁剪与单色化处理，以提升模型泛化能力。在评估阶段，除了常规的身份识别任务，还可利用数据集提供的姿态模板与年龄模板，专门测试模型在跨姿态与跨年龄场景下的匹配性能。此外，训练所得的模型特征可直接用于IJB-A、IJB-B、IJB-C等公开基准测试，以验证其在复杂无约束环境中的识别能力。数据集与预训练模型均已公开，便于社区进行复现与比较研究。

背景与挑战

背景概述

随着深度学习技术的迅猛发展，人脸识别领域对大规模、高质量数据集的需求日益迫切。VGGFace2数据集由牛津大学视觉几何组于2018年发布，旨在解决跨姿态和年龄的人脸识别问题。该数据集包含9131个身份的331万张图像，每个身份平均拥有362.6张图像，覆盖了广泛的姿态、年龄、光照、种族和职业变化。其核心研究目标是提升人脸识别模型在真实复杂场景下的泛化能力，通过精心设计的采集与过滤流程，显著降低了标签噪声，推动了人脸识别技术在实际应用中的进步。

当前挑战

VGGFace2数据集致力于应对跨姿态和年龄的人脸识别挑战，这一领域问题因姿态变化导致的特征变形和年龄增长带来的外貌差异而尤为复杂。在构建过程中，研究团队面临多重挑战：首先，从网络爬取的图像中确保每个身份的图像纯净度，需通过多阶段自动与手动过滤以消除标签噪声；其次，平衡数据集的广度与深度，即在增加身份数量的同时，保证每个身份有足够的图像以覆盖丰富的类内变化；此外，还需有效处理图像中的重复项，并解决身份重叠问题，以确保数据集的多样性与准确性。

常用场景

经典使用场景

在计算机视觉领域，人脸识别技术面临的核心挑战之一是如何在姿态和年龄变化下保持鲁棒性。VGGFace2数据集通过提供超过330万张图像，覆盖9131个身份，每个身份平均包含362.6张图像，且具有广泛的姿态、年龄、光照和种族变化，成为训练深度卷积神经网络（如ResNet-50和SENet）的经典基准。该数据集常用于评估模型在跨姿态（如正面、侧面）和跨年龄（如年轻与成熟）匹配场景下的性能，为研究者提供了丰富的实验数据以优化人脸识别算法的泛化能力。

解决学术问题

VGGFace2数据集主要解决了人脸识别研究中因姿态和年龄变化导致的识别性能下降问题。传统数据集往往侧重于身份数量的广度，而忽略了每个身份内部的多样性，导致模型在真实场景中表现不佳。该数据集通过精心设计的收集流程，确保了每个身份具有丰富的图像样本，涵盖了从正面到侧面的多种姿态以及不同年龄阶段的面部特征。这使研究者能够训练出更具鲁棒性的模型，显著提升了在IJB-A、IJB-B和IJB-C等基准测试上的识别准确率，推动了跨域人脸识别技术的发展。

衍生相关工作

VGGFace2数据集的发布催生了一系列经典研究工作，尤其是在深度学习和人脸识别模型的优化方面。例如，研究者利用该数据集训练了ResNet-50和Squeeze-and-Excitation网络（SENet），在IJB基准测试中实现了当时最先进的性能。这些工作进一步推动了跨姿态和年龄识别算法的发展，如基于模板匹配的验证方法和多任务学习框架。此外，该数据集还被用于预训练模型，结合其他数据集（如MS-Celeb-1M）进行微调，显著提升了模型的泛化能力，为后续大规模人脸识别系统的开发奠定了基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集