five

Flickr-Faces-HQ Dataset (FFHQ)

收藏
github2020-03-06 更新2024-05-31 收录
下载链接:
https://github.com/hukkelas/ffhq-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Flickr-Faces-HQ (FFHQ) 是一个高质量的人脸图像数据集,最初是为生成对抗网络 (GAN) 的基准测试而创建的。该数据集包含70,000张1024x1024分辨率的PNG图像,涵盖了年龄、种族和图像背景的显著变化,并良好覆盖了眼镜、太阳镜、帽子等配饰。这些图像是从Flickr爬取的,因此继承了该网站的所有偏见,并自动进行了对齐和裁剪。只有使用宽松许可证的图像被收集。使用了各种自动过滤器来修剪数据集,并最终使用Mechanical Turk来移除偶尔的雕像、绘画或照片中的照片。

Flickr-Faces-HQ (FFHQ) is a high-quality facial image dataset originally created for benchmarking Generative Adversarial Networks (GANs). The dataset comprises 70,000 PNG images with a resolution of 1024x1024, showcasing significant variations in age, ethnicity, and image backgrounds, and includes a good representation of accessories such as glasses, sunglasses, and hats. These images were scraped from Flickr, thus inheriting all the biases of the website, and were automatically aligned and cropped. Only images under permissive licenses were collected. Various automatic filters were employed to prune the dataset, and Mechanical Turk was ultimately used to remove occasional statues, paintings, or photographs within photographs.
创建时间:
2019-02-05
原始信息汇总

Flickr-Faces-HQ Dataset (FFHQ) 概述

数据集基本信息

  • 格式: PNG
  • 分辨率: 1024×1024
  • 图像数量: 70,000

数据集内容

  • 图像来源: 从Flickr网站爬取,包含年龄、种族和图像背景的显著变化,以及眼镜、太阳镜、帽子等配件的良好覆盖。
  • 图像处理: 自动对齐和裁剪。

数据集结构

  • 主文件夹: ffhq-dataset (1.28 TB)
  • 元数据: ffhq-dataset-v1.json (254 MB)
  • 高分辨率图像: images1024x1024 (89.1 GB)
  • 缩略图: thumbnails128x128 (1.95 GB)
  • 原始图像: in-the-wild-images (955 GB)
  • tfrecords: tfrecords (273 GB)

数据集使用

  • 训练与验证: 前60,000张图像用于训练,剩余10,000张用于验证。
  • 下载脚本: 提供download_ffhq.py脚本,支持自动下载、校验和重试。

元数据内容

  • 每个图像的详细信息: 包括图像索引、分类、元数据(如Flickr照片URL、作者、许可证等)、图像信息(如文件URL、路径、大小、MD5校验和等)、缩略图信息和原始图像信息。

许可证

  • 图像许可证: 根据原作者在Flickr上的发布,可能包括Creative Commons BY 2.0、Creative Commons BY-NC 2.0、Public Domain Mark 1.0、Public Domain CC0 1.0或U.S. Government Works。
  • 数据集许可证: 由NVIDIA Corporation提供,基于Creative Commons BY-NC-SA 4.0,允许非商业用途的使用、再分发和改编。
搜集汇总
数据集介绍
main_image_url
构建方式
Flickr-Faces-HQ (FFHQ)数据集通过从Flickr网站抓取70,000张高质量的人脸图片,并对这些图片进行自动对齐和裁剪处理构建而成。图片的分辨率均为1024×1024,涵盖了不同年龄、种族和背景的多样性。在构建过程中,仅选择遵循宽松许可协议的图片,并通过各种自动过滤器以及Mechanical Turk服务进一步筛选,确保数据集的质量和一致性。
特点
FFHQ数据集的特点在于其高质量和多样性。所有图片均为PNG格式,且具有清晰的人脸特征。数据集包含了不同年龄、种族、性别以及不同背景和装饰(如眼镜、帽子等)的图片,为研究提供了丰富的样本。此外,数据集还提供了详细的元数据信息,包括版权信息、图片原始链接等,方便用户了解和使用图片。数据集遵循Creative Commons许可,允许非商业用途下的免费使用、重分配和改编。
使用方法
用户可以通过提供的下载脚本来获取FFHQ数据集,脚本支持选择性下载元数据、图片、缩略图等。下载后,用户可以依据元数据中的信息,将数据集分为训练集和验证集。同时,元数据中的详细描述信息,如图片的原始链接、作者、上传日期等,有助于用户在使用图片时遵守相应的版权规定。数据集的多样性和高质量使其适合用于生成对抗网络(GAN)等视觉任务的训练和评估。
背景与挑战
背景概述
Flickr-Faces-HQ (FFHQ)数据集,创建于生成对抗网络(GAN)领域,旨在为GAN的生成模型提供一个高质量的人脸图像基准。该数据集由NVIDIA公司的Tero Karras、Samuli Laine和Timo Aila等研究人员开发,包含70,000张1024x1024分辨率的高质量PNG格式人脸图像。图像来源为Flickr网站,涵盖了不同年龄、种族和背景的多样性,并包含眼镜、帽子等配件。FFHQ数据集的创建,为研究人脸图像的生成、分析和识别提供了宝贵的资源,对相关领域产生了重要影响。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:1)如何从Flickr网站抓取并筛选出符合要求的高质量人脸图像;2)如何自动对图像进行对齐和裁剪以适应GAN的训练需求;3)如何处理图像版权问题,确保所有图像都遵循自由使用的许可协议。在所解决的领域问题方面,FFHQ数据集面临的挑战包括:如何利用这些高质量的人脸图像训练出更精确、更稳定的GAN模型,以及如何在实际应用中处理生成的图像与真实图像之间的差异。
常用场景
经典使用场景
FFHQ数据集作为高质量人脸图像的集合,其经典使用场景主要集中于生成对抗网络(GAN)的基准测试。该数据集为风格化GAN架构的研究提供了实验基础,通过其高质量的图像,研究者能够训练出能够生成逼真面部图像的模型,进而推动人脸图像合成技术的发展。
衍生相关工作
基于FFHQ数据集,衍生出了多项相关工作,如 StyleGAN 等模型的开发,这些工作不仅提高了图像生成的质量,还推动了面部图像编辑、增强现实(AR)技术以及个性化虚拟角色的创建等领域的进步。
数据集最近研究
最新研究方向
FFHQ数据集作为高质量人脸图像的集合,最初旨在为生成对抗网络(GAN)提供基准。近期研究方向主要集中于利用该数据集对GAN的架构进行优化,例如 StyleGAN 论文提出的基于风格的生成器架构。该数据集在人脸年龄、种族和背景方面具有丰富的变化,并且包含了眼镜、帽子等配件的广泛覆盖。这些特性使其成为研究人脸属性、身份识别和图像生成等领域的宝贵资源,对提升生成模型的逼真度和多样性具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作