MetFaces Dataset
收藏github2024-05-17 更新2024-05-31 收录
下载链接:
https://github.com/NVlabs/metfaces-dataset
下载链接
链接失效反馈官方服务:
资源简介:
MetFaces是一个从艺术作品中提取的人脸图像数据集,包含1336张高质量的1024x1024分辨率的PNG图像。这些图像通过大都会艺术博物馆的API下载,并使用dlib进行自动对齐和裁剪。
MetFaces is a dataset of facial images extracted from artworks, comprising 1,336 high-quality PNG images with a resolution of 1024x1024. These images were downloaded via the Metropolitan Museum of Art's API and were automatically aligned and cropped using dlib.
创建时间:
2020-06-13
原始信息汇总
MetFaces Dataset 概述
数据集描述
- 来源:MetFaces 数据集包含从艺术作品中提取的人脸图像,由 NVIDIA 创建。
- 目的:用于训练生成对抗网络(GANs),特别是在数据有限的情况下。
- 论文:该数据集是论文《Training Generative Adversarial Networks with Limited Data》的研究成果。
数据集内容
- 图像数量:1336张
- 图像分辨率:1024×1024像素
- 图像格式:PNG
- 处理方式:使用 dlib 进行自动对齐和裁剪,并通过自动过滤器进行筛选。
数据集结构
- 总大小:14.5 GB
- 文件数量:2621个
- 主要文件夹:metfaces-dataset
- 子文件夹及内容:
- metfaces.json:1.8 MB,包含图像元数据,如原始下载URL。
- images:1.6 GB,包含1336张对齐和裁剪后的图像。
- unprocessed:13 GB,包含1284张原始图像。
许可证
- 源图像:根据 Creative Commons Zero (CC0) 许可证提供。
- 数据集:根据 Creative Commons BY-NC 2.0 许可证提供,允许非商业用途的使用、重新分发和改编,需适当引用论文并标明任何更改。
数据集复制
- 使用
metfaces.py脚本可以复制 1024x1024 分辨率的 MetFaces 图像。 - 提供两种复制命令,用于生成标准和未对齐的 MetFaces 数据集。
元数据
- 包含信息:每个图像的详细信息,包括 Metmuseum 对象ID、元数据URL、原始图像路径、MD5校验和、标题、艺术家显示名称等。
- 额外信息:可通过元数据URL获取完整的 Metmuseum 元数据。
搜集汇总
数据集介绍

构建方式
MetFaces数据集的构建基于从纽约大都会艺术博物馆(Metropolitan Museum of Art)的艺术作品中提取的人脸图像。该数据集通过使用大都会博物馆的开放API下载原始图像,并利用dlib库进行自动对齐和裁剪,确保了图像的高质量。为了进一步优化数据集,研究人员采用了多种自动过滤器来剔除不符合要求的图像,最终形成了包含1336张1024×1024分辨率的高清PNG图像的数据集。
特点
MetFaces数据集的主要特点在于其图像的高分辨率和艺术性。所有图像均来自艺术作品,涵盖了不同历史时期和文化背景,为研究提供了丰富的视觉多样性。此外,数据集的图像经过精确的对齐和裁剪,确保了人脸区域的清晰度和一致性,使其在生成对抗网络(GAN)等深度学习任务中具有较高的应用价值。
使用方法
MetFaces数据集可以通过Google Drive下载,包含主文件夹、JSON格式的元数据以及处理后的图像。用户可以通过提供的`metfaces.py`脚本重新生成数据集,或直接使用预处理后的图像进行研究。数据集的元数据文件`metfaces.json`提供了每张图像的详细信息,包括原始下载URL、艺术家信息和人脸区域的具体坐标。该数据集适用于非商业用途,使用时需引用相关论文并注明修改内容。
背景与挑战
背景概述
MetFaces数据集是由NVIDIA的研究团队创建,专注于从艺术作品中提取的人脸图像,旨在支持生成对抗网络(GANs)在有限数据条件下的训练研究。该数据集的核心研究问题是如何在数据稀缺的情况下有效训练GANs,这一问题在计算机视觉领域具有重要意义。MetFaces数据集包含1336张高分辨率(1024×1024)的PNG图像,这些图像通过Metropolitan Museum of Art的API获取,并使用dlib库进行自动对齐和裁剪。该数据集的创建不仅推动了GANs在艺术图像处理中的应用,还为相关领域的研究提供了宝贵的资源。
当前挑战
MetFaces数据集在构建过程中面临多项挑战。首先,从艺术作品中提取高质量的人脸图像需要复杂的图像处理技术,包括自动对齐和裁剪,以确保图像的可用性和一致性。其次,数据集的构建涉及从大量艺术作品中筛选出适合的图像,这一过程需要应用多种自动过滤器,以去除不符合要求的图像。此外,由于艺术作品的多样性和复杂性,确保数据集的多样性和代表性也是一个重要挑战。最后,如何在有限的数据条件下有效训练GANs,以实现高质量的图像生成,是该数据集在应用中的主要挑战。
常用场景
经典使用场景
MetFaces数据集以其高质量的艺术人脸图像而著称,主要用于训练生成对抗网络(GANs)。由于其图像分辨率高且经过精细对齐,该数据集特别适用于研究如何在有限数据条件下优化GANs的训练过程。通过使用MetFaces数据集,研究人员可以探索如何在不依赖大量数据的情况下,提升生成模型的性能和稳定性。
实际应用
MetFaces数据集在实际应用中具有广泛的前景,特别是在艺术创作和数字人像生成领域。通过使用该数据集训练的生成模型,艺术家和设计师可以生成逼真的艺术人脸图像,用于创作、插画或虚拟现实中的角色设计。此外,该数据集还可用于影视制作中的特效生成,帮助制作团队快速生成高质量的艺术风格人脸。
衍生相关工作
MetFaces数据集的发布激发了大量相关研究工作,尤其是在生成对抗网络(GANs)和艺术风格迁移领域。许多研究者基于该数据集开发了新的GAN架构,以提升生成图像的质量和多样性。此外,MetFaces还被用于探索艺术风格迁移算法,使得计算机生成的图像能够模仿特定艺术家的风格。这些衍生工作不仅扩展了GANs的应用范围,还为艺术与技术的融合提供了新的研究方向。
以上内容由遇见数据集搜集并总结生成



