FoivosPar/Arc2Face

Name: FoivosPar/Arc2Face
Creator: FoivosPar
Published: 2024-07-05 18:54:47
License: 暂无描述

Hugging Face2024-07-05 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/FoivosPar/Arc2Face

下载链接

链接失效反馈

官方服务：

资源简介：

Arc2Face数据集包含约2100万张来自100万个身份的面部图像，分辨率为448×448。这些图像是通过对WebFace42M数据库中的图像进行上采样生成的。该数据集用于训练基于Stable Diffusion v1.5的身份条件生成面部模型Arc2Face。数据集结构包括35个压缩文件，每个文件约30GB，下载和解压缩可能需要较长时间。数据集采用Creative Commons BY-NC-SA 4.0许可证，允许非商业用途。

提供机构：

FoivosPar

原始信息汇总

数据集概述

数据集名称

Arc2Face

数据集内容

图像数量与分辨率：约21M面部图像，分辨率为448×448。
身份数量：来自1M个不同身份。
数据来源：由WebFace42M数据库的50%图像（原为112×112分辨率）通过先进的盲脸恢复网络（GFPGAN）进行上采样得到。

数据集用途

用于训练身份条件下的生成人脸模型，特别是针对Stable Diffusion v1.5模型，生成512×512像素的图像。

数据集结构

文件分布：分为35个zip文件，每个zip文件约30GB，分成5组，每组7个zip文件。
解压后结构：

Arc2Face_448x448 └── IDs └── images

许可证

类型：Creative Commons BY-NC-SA 4.0
使用限制：非商业用途，需引用原论文并标注任何修改。

引用信息

Arc2Face论文： bibtex @misc{paraperas2024arc2face, title={Arc2Face: A Foundation Model of Human Faces}, author={Foivos Paraperas Papantoniou and Alexandros Lattas and Stylianos Moschoglou and Jiankang Deng and Bernhard Kainz and Stefanos Zafeiriou}, year={2024}, eprint={2403.11641}, archivePrefix={arXiv}, primaryClass={cs.CV} }
WebFace42M原始数据集论文： bibtex @misc{zhu2021webface260m, title={WebFace260M: A Benchmark Unveiling the Power of Million-scale Deep Face Recognition}, author={Zheng Zhu, Guan Huang, Jiankang Deng, Yun Ye, Junjie Huang, Xinze Chen, Jiagang Zhu, Tian Yang, Jiwen Lu, Dalong Du, Jie Zhou}, booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)}, year={2021}
}

搜集汇总

数据集介绍

构建方式

Arc2Face数据集源自WebFace42M数据库，精选其中约100万身份对应的2100万张人脸图像构建而成。原始图像分辨率为112×112，研究团队采用先进的盲脸恢复网络GFPGAN对其中50%的图像进行上采样，最终生成448×448的高清人脸图像。这一精细化处理旨在满足大规模扩散模型对图像质量与分辨率的要求，为身份一致的人脸生成任务奠定数据基础。

特点

该数据集的核心优势在于其庞大的身份覆盖度和丰富的类内多样性，涵盖约100万独立身份，远超同类人脸数据集。尽管原始数据源自人脸识别场景，存在极端条件下的低质量图像，但经恢复与筛选后，仍保留了显著的生成训练价值。所有图像均为紧密裁剪的面部区域，适合与FFHQ等高质量数据集联合使用，以提升生成模型的整体表现。

使用方法

数据集以35个ZIP压缩包形式提供，分为5组，每组7个文件，每个文件约30GB。用户可通过Hugging Face Hub的hf_hub_download函数逐一下载，例如下载首个文件“0/0_0.zip”至本地目录，随后使用unzip命令解压至指定文件夹。解压后目录结构为“Arc2Face_448x448/IDs/images”，便于直接加载与集成至训练流程。鉴于数据量庞大，下载与解压过程耗时较长，需预留充足存储空间与时间。

背景与挑战

背景概述

在身份保持的人脸生成领域，如何在大规模身份变化下实现高保真度与一致性，始终是计算机视觉研究的核心难题。FoivosPar/Arc2Face数据集由帝国理工学院与伦敦大学学院等机构的研究人员于2024年创建，旨在支撑Arc2Face模型——一种基于Stable Diffusion的身份条件生成基础模型。该数据集源自WebFace42M数据库，通过先进盲人脸复原网络将半数图像上采样至448×448分辨率，最终汇集约2100万张涵盖100万身份的人脸图像。其核心研究问题在于弥合人脸识别数据集与生成模型需求之间的鸿沟，为身份条件生成提供充足的类内多样性。该成果发表于ECCV 2024，显著推动了身份一致人脸生成的研究边界，成为该领域重要的基准资源。

当前挑战

该数据集所面临的挑战体现在多个层面。首先，在领域问题层面，身份条件生成需在保持个体身份特征的同时，实现表情、姿态、光照等属性的自由变化，这要求数据集兼具身份广度与类内多样性，而原始WebFace42M为极端场景设计的人脸识别图像，在生成任务中易引入质量退化。其次，构建过程中，将低分辨率(112×112)图像上采样至高分辨率(448×448)时，尽管采用盲复原网络，仍难以完全消除模糊、伪影等瑕疵；过滤后数据集中仍存在部分低质量样本。此外，所有图像均为紧密裁剪的人脸区域，缺乏背景与上下文信息，限制了生成场景的丰富性。最后，数据集规模庞大(约1TB)，下载与解压耗时极长，给实际使用带来显著的存储与计算负担。

常用场景

经典使用场景

Arc2Face数据集最经典的使用场景在于训练身份一致性的人脸生成模型。该数据集包含约2100万张来自100万个身份的高分辨率人脸图像（448×448），通过对WebFace42M数据库中的图像进行盲人脸复原上采样得到。其庞大的身份数量和丰富的类内多样性，使其特别适合作为身份条件生成任务的训练基石。研究者通常将其与FFHQ等高质量数据集联合使用，以弥补其仅包含紧密裁剪面部区域和部分低质量图像的不足，从而在扩散模型框架下实现高保真、身份保持的人脸生成。

衍生相关工作

基于Arc2Face数据集，衍生了一系列具有影响力的研究工作。其核心成果Arc2Face模型本身即发表于ECCV 2024，提出了一个基于Stable Diffusion的身份保持人脸生成基础模型。该工作启发了后续多项研究，包括将身份条件生成扩展到视频人脸生成、3D人脸重建与渲染等方向。此外，该数据集的构建方法——利用盲人脸复原网络增强低分辨率人脸数据库——也为其他大规模人脸数据集的提质提供了新范式，推动了人脸生成领域从数据规模向数据质量的范式转变。

数据集最近研究