Hybrid Fake Face Dataset

github2024-04-19 更新2024-05-31 收录

下载链接：

https://github.com/EricGzq/Hybrid-Fake-Face-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

我们构建了一个混合假脸（HFF）数据集，包含八种类型的面部图像。真实面部图像从三个开放数据集中随机选择，包括CelebA的低分辨率面部图像、CelebA-HQ的高分辨率面部图像以及FaceForensics的面部视频帧。此外，还使用了PGGAN、StyleGAN、Glow和StarGAN等技术生成了假面部图像。HFF数据集是一个大型假面部数据集，包含超过155,000张面部图像。

We have constructed a Hybrid Fake Face (HFF) dataset, encompassing eight types of facial images. Real facial images were randomly selected from three open datasets, including low-resolution facial images from CelebA, high-resolution facial images from CelebA-HQ, and facial video frames from FaceForensics. Additionally, fake facial images were generated using technologies such as PGGAN, StyleGAN, Glow, and StarGAN. The HFF dataset is a large-scale fake facial dataset, containing over 155,000 facial images.

创建时间：

2019-07-30

原始信息汇总

Hybrid Fake Face Dataset 概述

数据集内容

类型：混合假脸（HFF）数据集
包含内容：
- 真实人脸图像：
  - 低分辨率图像来自 CelebA
  - 高分辨率图像来自 CelebA-HQ
  - 视频帧来自 FaceForensics
- 假人脸图像：
  - 身份操纵：使用 PGGAN 和 StyleGAN
  - 面部表情操纵：使用 Face2Face 和 Glow
  - 面部属性转移：使用 StarGAN
规模：超过 155,000 张人脸图像

使用条款

目的：仅限非商业研究及教育用途
责任：研究者需对数据集的使用承担全部责任
分发：允许在他人接受相同使用条款的前提下分享数据集
终止权：数据集提供方保留随时终止研究者访问数据集的权利

下载流程

前提：同意上述使用条款
步骤：填写个人信息及研究目的，发送至 guozhiqing@xju.edu.cn

引用信息

引用格式：

@article{AMTEN, title={Fake face detection via adaptive manipulation traces extraction network}, author={Guo, Zhiqing and Yang, Gaobo and Chen, Jiyou and Sun, Xingming}, journal={Computer Vision and Image Understanding}, volume={204}, pages={103170}, year={2021}, publisher={Elsevier} }

搜集汇总

数据集介绍

构建方式

在构建Hybrid Fake Face Dataset时，研究团队精心设计了数据集的组成结构。首先，从三个公开数据集中随机选取了三类真实人脸图像，包括来自CelebA的低分辨率图像、CelebA-HQ的高分辨率图像以及FaceForensics中的人脸视频帧，以模拟真实网络场景下的人脸图像。随后，采用多种具有代表性的人脸处理技术生成假脸图像，包括用于身份操作的PGGAN和StyleGAN、用于表情操作的Face2Face和Glow，以及用于属性转移的StarGAN。通过这些技术的结合，数据集成功地涵盖了超过155,000张人脸图像，形成了丰富且多样化的混合假脸数据集。

特点

Hybrid Fake Face Dataset的显著特点在于其多样性和复杂性。数据集不仅包含了多种分辨率的真实人脸图像，还通过多种先进的人脸处理技术生成了多样化的假脸图像，涵盖了身份、表情和属性等多个维度的操作。这种多样性使得该数据集在人脸识别和假脸检测等领域的研究中具有极高的应用价值。此外，数据集的规模庞大，提供了丰富的样本，有助于研究者进行深入的模型训练和验证。

使用方法

使用Hybrid Fake Face Dataset时，研究者需遵循特定的使用条款。首先，数据集仅限于非商业研究及教育用途，研究者需对其使用行为承担全部责任，并确保数据提供者免受任何因数据使用而产生的索赔。其次，研究者若希望将数据集分享给他人，需确保对方同意并遵守相同的使用条款。最后，研究者在使用数据集时，应引用相关文献以确保学术诚信。如需下载数据集，需通过指定邮箱提交相关信息，包括姓名、所属机构、研究目的等。

背景与挑战

背景概述

在人脸识别与伪造检测领域，随着深度学习技术的迅猛发展，生成对抗网络（GANs）等技术被广泛应用于人脸图像的生成与篡改。为此，研究人员构建了Hybrid Fake Face Dataset（HFF数据集），该数据集包含了八种不同类型的人脸图像，旨在模拟真实互联网场景下的人脸图像。HFF数据集通过从CelebA、CelebA-HQ和FaceForensics等公开数据集中随机选取真实人脸图像，并结合PGGAN、StyleGAN、Face2Face、Glow和StarGAN等先进的人脸篡改技术生成伪造图像，最终形成了超过15.5万张人脸图像的庞大数据集。该数据集的创建不仅为研究人脸伪造检测提供了丰富的资源，还为相关领域的算法评估和模型训练提供了坚实的基础。

当前挑战

HFF数据集的构建面临多重挑战。首先，如何从多个公开数据集中选取并整合高质量的真实人脸图像，以确保数据集的真实性和多样性，是一个复杂的问题。其次，选择和应用多种先进的人脸篡改技术生成伪造图像，要求研究人员对这些技术的特性有深入的理解，并确保生成的伪造图像具有高度的逼真性和多样性。此外，数据集的规模庞大，如何在保证数据质量的同时高效地进行数据管理和分发，也是一项重要的挑战。最后，由于数据集涉及人脸图像的隐私和伦理问题，如何确保数据集的使用符合伦理规范，并防止数据被滥用，也是研究人员必须面对的难题。

常用场景

经典使用场景

Hybrid Fake Face Dataset（HFF数据集）在人脸图像处理领域中，主要用于检测和识别经过合成或篡改的虚假人脸图像。该数据集通过结合多种先进的人脸生成和篡改技术，如PGGAN、StyleGAN、Face2Face、Glow和StarGAN，生成了大量高质量的虚假人脸图像。这些图像与真实人脸图像混合，为研究人员提供了丰富的数据资源，用于开发和验证人脸篡改检测算法。

衍生相关工作

基于HFF数据集，许多研究工作得以展开，包括但不限于人脸篡改检测算法的优化、深度学习模型的改进以及跨领域应用的探索。例如，Guo等人提出的自适应篡改痕迹提取网络（AMTENnet）即是在该数据集上进行训练和验证的。此外，该数据集还激发了关于人脸图像生成与篡改技术的进一步研究，推动了计算机视觉领域的技术进步。

数据集最近研究