Flickr-Faces-HQ Dataset (FFHQ)
收藏github2019-09-15 更新2024-05-31 收录
下载链接:
https://github.com/getamazednow/ffhq-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Flickr-Faces-HQ (FFHQ) 是一个高质量的人脸图像数据集,最初是为生成对抗网络(GAN)的基准而创建的。该数据集包含70,000张1024x1024分辨率的PNG图像,涵盖了年龄、种族和图像背景的显著变化,并良好覆盖了眼镜、太阳镜、帽子等配件。数据集从Flickr网站爬取,继承了该网站的所有偏见,并使用dlib自动对齐和裁剪。
Flickr-Faces-HQ (FFHQ) is a high-quality facial image dataset originally created for benchmarking Generative Adversarial Networks (GANs). The dataset comprises 70,000 PNG images with a resolution of 1024x1024, showcasing significant variations in age, ethnicity, and image backgrounds, and provides good coverage of accessories such as glasses, sunglasses, and hats. The dataset was scraped from the Flickr website, inheriting all its biases, and was automatically aligned and cropped using dlib.
创建时间:
2019-09-15
原始信息汇总
Flickr-Faces-HQ Dataset (FFHQ) 概述
数据集基本信息
- 名称: Flickr-Faces-HQ (FFHQ)
- 格式: PNG
- 分辨率: 1024×1024
- 图像数量: 70,000
- 许可证: 主要为Creative Commons BY 2.0, BY-NC 2.0, Public Domain Mark 1.0, Public Domain CC0 1.0, U.S. Government Works,允许免费使用、重新分发和改编,部分需注明原作者及修改内容。
数据集内容
- 主文件夹: ffhq-dataset,大小2.56 TB,包含210,014个文件。
- 元数据: ffhq-dataset-v2.json,大小255 MB,包含版权信息、URL等。
- 图像: images1024x1024,大小89.1 GB,包含70,000张1024×1024分辨率的PNG图像。
- 缩略图: thumbnails128x128,大小1.95 GB,包含70,000张128×128分辨率的PNG图像。
- 原始图像: in-the-wild-images,大小955 GB,包含70,000张原始PNG图像。
- tfrecords: 大小273 GB,用于StyleGAN和ProGAN的多分辨率数据。
数据集使用
- 训练与验证: 前60,000张图像用于训练,剩余10,000张用于验证。
- 下载: 提供下载脚本download_ffhq.py,支持自动下载、校验和重试。
元数据详情
- 每张图像包含: 类别(训练或验证)、原始Flickr照片信息(URL、作者、许可证等)、1024x1024图像信息(URL、路径、大小、MD5等)、128x128缩略图信息、原始图像信息(URL、路径、大小、MD5等)。
许可证
- 数据集本身: 由NVIDIA Corporation根据Creative Commons BY-NC-SA 4.0许可证提供,允许非商业目的的使用、重新分发和改编,需注明引用论文、标明修改内容,并使衍生作品遵循相同许可证。
搜集汇总
数据集介绍

构建方式
Flickr-Faces-HQ Dataset (FFHQ) 是通过从Flickr网站抓取符合特定许可的高质量人脸图像构建而成的。图像经过自动对齐和裁剪,以确保面部特征的一致性,并使用dlib库进行面部标志点的检测。数据集中包含了70,000张1024×1024分辨率的PNG格式图像,涵盖了不同年龄、种族和背景的多样性。通过使用Amazon Mechanical Turk进一步清除不符合要求的图像,保证了数据集的质量。
使用方法
用户可以通过提供的下载脚本来获取FFHQ数据集,该脚本支持选择性地下载元数据、图像、缩略图等。此外,数据集的使用需要遵守相应的许可协议,对于非商业性用途,用户可以自由使用和改编数据集,但需给予适当的归属,并遵守相同的许可协议分发衍生作品。
背景与挑战
背景概述
Flickr-Faces-HQ (FFHQ)数据集是由NVIDIA的研究人员Tero Karras、Samuli Laine和Timo Aila于2018年创建的,旨在为生成对抗网络(GAN)提供一个高质量的人脸图像基准。该数据集包含70,000张1024×1024分辨率的高质量PNG格式图像,涵盖了不同年龄、种族和背景的多样性。FFHQ数据集通过从Flickr网站抓取图像并使用dlib自动对齐和裁剪而构建,仅包含授权许可的图像。该数据集对GAN领域的研究产生了重大影响,尤其是在风格化的人脸生成方面。
当前挑战
在构建FFHQ数据集的过程中,研究人员面临了多项挑战。首先,需要筛选出高质量且符合许可要求的图像,这涉及自动过滤和人工审核。其次,图像的对齐和裁剪需要精确的算法来保证人脸特征的一致性。此外,数据集的多样性和无重复性要求在图像选择和预处理阶段进行严格的质量控制。在研究领域问题方面,FFHQ数据集面临的挑战包括如何更准确地捕捉人脸的多样性和细微特征,以及如何在保证隐私的同时进行数据共享和再利用。
常用场景
经典使用场景
FFHQ数据集作为高质量人脸图像的集合,其经典使用场景主要集中于生成对抗网络(GAN)的性能评估。该数据集提供了70000张1024x1024分辨率的高质量PNG格式人脸图像,涵盖了不同年龄、种族和背景的多样性。它被广泛用于训练和测试生成人脸图像的算法,如StyleGAN等,以评估生成的人脸图像质量、真实性和多样性。
解决学术问题
该数据集解决了传统人脸数据集在图像质量和多样性上的局限性问题。FFHQ的高分辨率和多样化特征使得研究者在进行人脸识别、人脸合成、情感分析等学术研究时,能够获得更为准确和可靠的实验结果。此外,它还帮助推动了生成模型,特别是在GAN领域的发展,为相关算法的训练和评估提供了宝贵的数据资源。
实际应用
在实际应用中,FFHQ数据集可用于提升图像处理和计算机视觉系统的人脸识别能力,如安全系统的面部验证、智能监控、虚拟现实等领域。高质量的人脸图像能够提高系统的准确度和鲁棒性,为用户提供更加安全便捷的服务。
数据集最近研究
最新研究方向
Flickr-Faces-HQ Dataset (FFHQ)作为高质量人脸图像数据集,被广泛应用于生成对抗网络(GAN)领域,特别是风格化GAN架构的研究。该数据集涵盖了不同年龄、种族和背景的丰富变化,以及眼镜、帽子等附件,为研究提供了良好的基础。目前,该数据集在前沿研究方向主要用于深度学习模型的训练与验证,特别是在人脸识别、图像合成和编辑等方面的应用,对提升算法的准确性和泛化能力具有重要意义。
以上内容由遇见数据集搜集并总结生成



