Flickr-Faces-HQ Dataset (FFHQ)
收藏github2019-02-09 更新2024-05-31 收录
下载链接:
https://github.com/CharlotteSean/ffhq-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Flickr-Faces-HQ (FFHQ) 是一个高质量的人脸图像数据集,最初是为生成对抗网络(GAN)的基准而创建的。该数据集包含70,000张1024×1024分辨率的PNG图像,涵盖了年龄、种族和图像背景的显著变化,并良好覆盖了眼镜、太阳镜、帽子等配件。数据集从Flickr网站爬取,继承了该网站的所有偏见,并使用dlib自动对齐和裁剪。只有使用宽松许可证的图像被收集,并使用多种自动过滤器进行修剪,最后通过Amazon Mechanical Turk移除了偶尔的雕像、绘画或照片中的照片。
Flickr-Faces-HQ (FFHQ) is a high-quality facial image dataset originally created for benchmarking Generative Adversarial Networks (GANs). The dataset comprises 70,000 PNG images with a resolution of 1024×1024, showcasing significant variations in age, ethnicity, and image backgrounds, and provides good coverage of accessories such as glasses, sunglasses, and hats. The images were scraped from the Flickr website, inheriting all the biases present on the platform, and were automatically aligned and cropped using dlib. Only images under permissive licenses were collected, and multiple automated filters were applied to refine the dataset. Finally, occasional statues, paintings, or photographs within photographs were removed through Amazon Mechanical Turk.
创建时间:
2019-02-09
原始信息汇总
数据集概述
数据集名称
Flickr-Faces-HQ Dataset (FFHQ)
数据集描述
FFHQ是一个高质量的人脸图像数据集,包含70,000张1024×1024分辨率的PNG格式图片。该数据集在年龄、种族和图像背景方面具有显著的多样性,并涵盖了眼镜、太阳镜、帽子等配件。
数据集特点
- 分辨率:1024×1024
- 格式:PNG
- 图像数量:70,000
- 来源:从Flickr网站爬取,经过自动对齐和裁剪处理
- 多样性:包括年龄、种族、背景及配件的广泛变化
数据集内容
- 主文件夹:包含所有数据,总计1.28 TB
- JSON元数据:包含版权信息、URL等,大小254 MB
- 1024x1024图像:70,000张,大小89.1 GB
- 128x128缩略图:70,000张,大小1.95 GB
- 原图:70,000张,大小955 GB
- tfrecords:用于StyleGAN和ProGAN的多分辨率数据,大小273 GB
数据集使用
- 训练与验证:前60,000张图像用于训练,剩余10,000张用于验证
- 无重复图像:数据集内无重复图像,但
in-the-wild文件夹可能包含同一图像的多个版本
数据集下载
- 下载脚本:提供
download_ffhq.py脚本,支持自动下载、校验和重试功能
元数据信息
- JSON文件:包含每张图像的详细信息,如原始Flickr照片信息、对齐图像信息、缩略图信息及原图信息
许可证
- 图像:根据不同许可证发布,允许非商业用途的免费使用、再分发和修改
- 数据集:根据Creative Commons BY-NC-SA 4.0许可证发布,允许非商业用途的使用、再分发和修改,需引用论文并标明更改
致谢
- 感谢多位研究者和团队在数据收集、处理和基础设施支持方面的贡献
搜集汇总
数据集介绍

构建方式
FFHQ数据集的构建采取了对Flickr网站进行图片抓取的方式,随后利用dlib库自动对图片中的人脸进行对齐和裁剪。该数据集特别筛选了70,000张分辨率高达1024x1024的高质量PNG格式人像图片,涵盖了不同年龄、种族和背景的多样性。图片经过多种自动过滤器的筛选,并通过Amazon Mechanical Turk服务进一步移除了不合格的图片,如雕塑、绘画或照片的照片。
特点
FFHQ数据集的主要特点在于其高质量、高分辨率的图片,以及丰富的多样性,包含了不同的人种、年龄和背景。所有图片均遵循宽松的许可协议,允许非商业用途下的免费使用、重分销和改编。此外,数据集提供了详细的JSON格式元数据,其中包含了每张图片的版权信息和原始作者的详细信息。
使用方法
用户可以通过提供的下载脚本来获取FFHQ数据集。该脚本支持选择下载不同的数据集部分,如元数据JSON文件、1024x1024的图片、128x128的缩略图、原始的野生动植物图片以及多分辨率的TFRecords文件。下载后,用户可以依据JSON元数据中的信息,对图片进行相应的处理和使用。
背景与挑战
背景概述
FFHQ数据集,全称为Flickr-Faces-HQ,是由NVIDIA公司的研究人员Tero Karras、Samuli Laine和Timo Aila创建的高质量人脸图像数据集,旨在为生成对抗网络(GAN)提供基准。该数据集包含70,000张分辨率为1024x1024的PNG格式图像,涵盖了不同年龄、种族和背景的多样性。图像源自Flickr网站,经自动对齐和裁剪处理,并使用了Amazon Mechanical Turk来清除不符合要求的图像。FFHQ数据集的创建对GAN领域的研究产生了重要影响,特别是在人脸生成和风格化方面。
当前挑战
FFHQ数据集在构建过程中面临的挑战主要包括:1) 从Flickr网站抓取图像时,需要处理和避免网站固有的偏见;2) 图像的自动对齐和裁剪需要精确的算法以确保质量;3) 为了确保数据集的多样性,需要对图像进行细致的筛选和分类。此外,数据集在解决人脸图像分类问题的同时也面临挑战,例如如何更准确地捕捉和表达人脸的细微差异和多样性。
常用场景
经典使用场景
FFHQ数据集作为高质量人脸图像的集合,其经典使用场景主要在于为生成对抗网络(GAN)提供训练基准,特别是风格化GAN架构的研究与开发。该数据集包含的高分辨率图像使得研究人员能够训练出能够生成高质量、多样化人脸的模型。
实际应用
在实际应用中,FFHQ数据集可用于人脸识别系统的训练,提升系统对多样化人脸的识别能力;在虚拟现实和游戏开发中,可用于创建更加真实的人物模型;此外,在安全和监控领域,该数据集有助于提高人脸分析技术的准确性和鲁棒性。
衍生相关工作
基于FFHQ数据集,衍生出了一系列相关研究工作,包括但不限于对GAN架构的改进、人脸属性编辑、人脸图像的隐私保护等。这些工作进一步扩展了FFHQ数据集的应用范围,并推动了计算机视觉和人脸分析领域的创新。
以上内容由遇见数据集搜集并总结生成



