FFHQ, VGGFace2, Celeb-Ref

github2024-11-22 更新2024-11-28 收录

下载链接：

https://github.com/YingJiacheng/RestorerID

下载链接

链接失效反馈

官方服务：

资源简介：

FFHQ是一个高质量的人脸图像数据集，包含70,000张1024x1024分辨率的图像。VGGFace2是一个大规模的人脸识别数据集，包含331万张图像，涵盖了9131个身份。Celeb-Ref是一个用于人脸参考的数据集，具体描述未提供。

FFHQ is a high-quality facial image dataset containing 70,000 images with a resolution of 1024x1024. VGGFace2 is a large-scale facial recognition dataset consisting of 3.31 million images covering 9131 identities. Celeb-Ref is a dataset for facial reference, whose specific description is not provided.

创建时间：

2024-11-21

原始信息汇总

RestorerID: Towards Tuning-Free Face Restoration with ID Preservation

数据集

FFHQ
VGGFace2
Celeb-Ref

训练

基础模型训练
- 下载预训练模型 runwayml/v1-5-pruned.ckpt 并放置在 ckpt/v1-5-pruned.ckpt 路径下。
- 准备数据集。
- 运行命令： bash CUDA_VISIBLE_DEVICES=0,1 python train_basemodel.py --train --base configs/v15/v15-BaseModel.yaml --name v15_basemodel --scale_lr False
RestorerID 模型训练
- 重命名训练好的基础模型并放置在 ckpt/basemodel.ckpt 路径下。
- 下载 ip-adapter-faceid-plus_sd15.bin 并放置在 ckpt/ip-adapter-faceid-plus_sd15.bin 路径下。
- 准备数据集。
- 合并基础模型与 ID 模型。
- 运行命令： bash python Combineckpt.py CUDA_VISIBLE_DEVICES=0,1 python train_RestorerID.py --train --base configs/v15/v15-RestorerID.yaml --name RestorerID --scale_lr False

推理

下载预训练模型 RestorerIDFull.ckpt 并放置在 ckpt/RestorerIDFull.ckpt 路径下。
运行推理脚本： bash bash inference.sh

或 bash CUDA_VISIBLE_DEVICES=0 python scripts/Inference.py --LQpath TestSamples/1/lq1.png --Refpath TestSamples/1/ref1.png --Outputpath Results/1/

许可证

该项目基于 Apache 2.0 许可证发布。

搜集汇总

数据集介绍

构建方式

在构建FFHQ、VGGFace2和Celeb-Ref数据集时，研究者们采用了多源数据融合的方法。首先，FFHQ数据集通过从Flickr上收集的高质量人脸图像构建，确保了图像的多样性和高分辨率。其次，VGGFace2数据集则通过从Google和Bing等搜索引擎中抓取的大量人脸图像构建，涵盖了广泛的年龄、种族和表情。最后，Celeb-Ref数据集通过从公开的影视资料中提取的高质量人脸图像构建，确保了图像的清晰度和真实性。这些数据集的构建过程均经过严格的筛选和预处理，以确保数据的质量和一致性。

特点

FFHQ、VGGFace2和Celeb-Ref数据集的显著特点在于其广泛的数据覆盖和高质量的图像。FFHQ数据集包含了70,000张高分辨率的人脸图像，涵盖了多样化的年龄、种族和表情。VGGFace2数据集则包含了超过3百万张人脸图像，提供了极其丰富的人脸特征。Celeb-Ref数据集通过从影视资料中提取的高质量图像，确保了人脸图像的真实性和清晰度。这些特点使得这些数据集在人脸识别、图像增强和深度学习模型的训练中具有极高的应用价值。

使用方法

使用FFHQ、VGGFace2和Celeb-Ref数据集时，用户可以通过预先定义的脚本进行数据集的下载和预处理。首先，用户可以通过conda环境配置文件创建并激活相应的环境，然后安装必要的依赖包。接着，用户可以通过提供的脚本进行数据集的下载和预处理，确保数据的一致性和可用性。在模型训练和推理阶段，用户可以通过指定的配置文件和脚本进行模型的训练和推理，确保模型的高效性和准确性。此外，用户还可以通过Hugging Face平台下载预训练模型，进一步简化模型的使用流程。

背景与挑战

背景概述

在人脸识别与恢复领域，FFHQ、VGGFace2和Celeb-Ref数据集扮演着至关重要的角色。这些数据集由知名研究机构和学者创建，旨在解决复杂的人脸图像恢复问题。FFHQ数据集，由NVIDIA于2019年发布，包含了70,000张高质量的人脸图像，广泛用于人脸识别和生成对抗网络（GAN）的研究。VGGFace2数据集则由牛津大学于2018年推出，包含超过330万张图像，涵盖了广泛的年龄、种族和姿态变化，为人脸识别算法的鲁棒性提供了丰富的数据支持。Celeb-Ref数据集则专注于提供高质量的参考图像，以辅助人脸恢复任务。这些数据集的创建不仅推动了人脸识别技术的发展，也为后续的深度学习研究提供了坚实的基础。

当前挑战

尽管FFHQ、VGGFace2和Celeb-Ref数据集在人脸识别与恢复领域取得了显著成就，但仍面临诸多挑战。首先，数据集的构建过程中，如何确保图像的高质量和多样性是一个持续的挑战。例如，FFHQ数据集在处理不同光照、姿态和表情时，需要克服图像质量不一致的问题。其次，VGGFace2数据集在处理大规模数据时，面临着数据标注和存储的巨大压力。此外，Celeb-Ref数据集在提供参考图像时，如何确保其与目标图像的高度匹配，也是一个技术难题。这些挑战不仅影响了数据集的实用性，也限制了相关算法性能的进一步提升。

常用场景

经典使用场景

在人脸识别与修复领域，FFHQ、VGGFace2和Celeb-Ref数据集被广泛应用于训练和验证高级人脸恢复模型。这些数据集包含了大量高质量的人脸图像，涵盖了多样化的年龄、种族和表情，为模型提供了丰富的训练样本。通过结合这些数据集，研究人员能够开发出能够有效恢复低质量人脸图像并保持身份信息不变的算法，如RestorerID模型。这种模型在图像增强、人脸识别系统优化以及数字娱乐等领域具有广泛的应用前景。

衍生相关工作

基于FFHQ、VGGFace2和Celeb-Ref数据集的研究工作衍生出了许多经典的人脸识别和图像处理技术。例如，StableSR和IPAdapter等项目通过利用这些数据集，开发出了高效的人脸图像超分辨率和特征提取方法。这些技术不仅在学术界引起了广泛关注，也在工业界得到了实际应用，推动了人脸识别和图像处理技术的进步。此外，这些数据集还激发了更多关于数据增强和模型泛化能力的研究，进一步丰富了该领域的理论和实践。

数据集最近研究