Flickr-Faces-HQ (FFHQ)
收藏github2020-04-09 更新2024-05-31 收录
下载链接:
https://github.com/Coderx7/ffhq-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Flickr-Faces-HQ (FFHQ) 是一个高质量的人脸图像数据集,最初是为生成对抗网络(GAN)的基准而创建的。该数据集包含70,000张1024x1024分辨率的PNG图像,涵盖了年龄、种族和图像背景的显著变化,并良好地覆盖了眼镜、太阳镜、帽子等配饰。图像从Flickr网站爬取,使用dlib自动对齐和裁剪,仅收集了使用许可的图像。
Flickr-Faces-HQ (FFHQ) is a high-quality facial image dataset originally created for benchmarking generative adversarial networks (GANs). The dataset comprises 70,000 PNG images with a resolution of 1024x1024, showcasing significant variations in age, ethnicity, and image backgrounds, and well-representing accessories such as glasses, sunglasses, and hats. The images were scraped from the Flickr website, automatically aligned and cropped using dlib, and only images with usage permissions were collected.
创建时间:
2020-01-14
原始信息汇总
Flickr-Faces-HQ Dataset (FFHQ) 概述
数据集基本信息
- 名称: Flickr-Faces-HQ (FFHQ)
- 格式: PNG
- 分辨率: 1024×1024
- 图像数量: 70,000
- 创建目的: 作为生成对抗网络(GAN)的基准
数据集内容
- 图像: 70,000张高分辨率PNG图像,包含年龄、种族和图像背景的显著变化,以及多种配件如眼镜、太阳镜、帽子等。
- 原始图像: 从Flickr爬取,自动对齐和裁剪。
- 许可证: 图像作者在Flickr上发布的许可证包括Creative Commons BY 2.0, Creative Commons BY-NC 2.0, Public Domain Mark 1.0, Public Domain CC0 1.0, U.S. Government Works。所有这些许可证允许免费使用、重新分发和改编,但某些许可证要求适当引用原作者并指出任何更改。
数据集结构
- 主文件夹: ffhq-dataset (2.56 TB)
- 元数据: ffhq-dataset-v2.json (255 MB)
- 高分辨率图像: images1024x1024 (89.1 GB)
- 缩略图: thumbnails128x128 (1.95 GB)
- 原始Flickr图像: in-the-wild-images (955 GB)
- TFRecords: tfrecords (273 GB)
使用指南
- 下载脚本: 提供
download_ffhq.py脚本,用于自动下载数据集文件,验证校验和,并在下载失败时重试。 - 训练与验证: 前60,000张图像用于训练,剩余10,000张用于验证。
许可证
- 数据集本身: 由NVIDIA Corporation根据Creative Commons BY-NC-SA 4.0许可证提供,允许非商业用途的使用、重新分发和改编,需引用论文,指出任何更改,并使衍生作品遵循相同许可证。
隐私保护
- 提供搜索功能以检查个人照片是否包含在数据集中,并提供移除流程。
搜集汇总
数据集介绍

构建方式
Flickr-Faces-HQ (FFHQ)数据集的构建是通过从Flickr网站抓取高质量的人脸图片,经过自动校准和对齐处理,最终形成了一个包含70,000张1024x1024分辨率PNG格式图片的数据集。图片的选取涵盖了不同年龄、种族和背景的多样性,并且还包含了眼镜、太阳镜、帽子等附件。所有图片均遵循宽松的许可协议,以便于非商业用途的自由使用和再分发。
特点
FFHQ数据集的特点在于其高质量和多样性。图片经过精心挑选和处理,确保了高分辨率和良好的对齐质量。数据集包含了详尽的元数据,记录了每张图片的来源、许可信息和面部特征点,便于研究者和开发人员的使用。此外,数据集还提供了不同尺寸的缩略图和原始的野外图片,以适应不同的研究需求。
使用方法
使用FFHQ数据集时,用户可以通过提供的下载脚本来获取数据,脚本支持选择性下载不同类型的文件,如JSON元数据、图片、缩略图等。用户还可以利用脚本对图片进行重新对齐,以恢复校准后的原始图片。在使用数据集时,需遵守相应的许可协议,并在非商业研究用途中给予适当的引用和归属。
背景与挑战
背景概述
Flickr-Faces-HQ (FFHQ)数据集是一款高质量的人脸图像数据集,创建于2018年,由NVIDIA公司的Tero Karras、Samuli Laine和Timo Aila等研究人员为生成对抗网络(GAN)的基准测试而设计。该数据集包含70,000张1024×1024分辨率的高质量PNG格式图像,涵盖了不同年龄、种族和背景的多样性。FFHQ数据集通过从Flickr网站爬取图像,经自动对齐和裁剪处理后形成,旨在为 StyleGAN 架构提供风格化的图像生成基准,对相关领域的图像处理技术发展产生了重要影响。
当前挑战
FFHQ数据集在构建过程中面临的挑战主要包括:确保图像的高质量和多样性,处理图像的版权和隐私问题,以及实现图像的自动对齐和裁剪。此外,数据集在解决图像分类等领域的挑战时,需要应对如何更精确地捕捉人脸特征、减少偏差以及提升数据集的泛化能力等问题。
常用场景
经典使用场景
Flickr-Faces-HQ (FFHQ)数据集作为高质量人脸图像的集合,其经典使用场景主要在于为生成对抗网络(GAN)的训练提供高质量的数据源。该数据集特别适用于 StyleGAN 和 StyleGAN2 架构的研究和开发,通过其提供的70,000张1024x1024分辨率的高质量PNG图像,研究者能够训练出在年龄、种族和图像背景上具有广泛变异的人脸生成模型。
实际应用
在实际应用中,FFHQ数据集可以被用于人脸识别系统的训练,以及创建个性化的人脸合成应用。此外,它在虚拟现实、动画制作以及游戏开发等领域也具有广泛的应用潜力,可以为这些领域提供真实的人脸图像素材,提升用户体验。
衍生相关工作
基于FFHQ数据集,研究者已经衍生出了一系列相关工作,包括但不限于改进GAN架构、人脸属性识别、以及图像质量增强等领域的研究。这些工作不仅推动了人脸图像处理技术的进步,也为相关领域的应用提供了新的方法和工具。
以上内容由遇见数据集搜集并总结生成



