Anime Face Dataset

github2024-05-07 更新2024-05-31 收录

下载链接：

https://github.com/SiskonEmilia/Anime-Wifu-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于生成动漫脸谱数据集的工具包。默认设置下，可以生成超过8000张图像样本。该数据集本身不包含元信息，但用户可以使用Illustration2Vec等工具自行估计。数据集是从视频游戏中的CG图像中提取的，以确保图像质量稳定且高质量。

This is a toolkit designed for generating anime facial datasets. Under default settings, it can produce over 8,000 image samples. The dataset itself does not include metadata, but users can estimate it using tools such as Illustration2Vec. The images in the dataset are extracted from CG images in video games to ensure stable and high-quality image output.

创建时间：

2019-05-21

原始信息汇总

Anime Face Dataset 概述

数据集描述

生成工具：该数据集是通过一个工具包生成的，默认设置下可生成超过8000张动漫脸图像样本。
图像来源：图像主要从Getchu收集，筛选自2013年以后发布的游戏CG。
图像处理：使用Libcascade Animeface进行面部检测和裁剪，并通过Wifu2x将图像放大至128x128像素。
注意事项：不建议对图像进行超过两次的放大处理，以避免引入噪声和模糊轮廓。

数据集用途

生成高质量动漫脸图像：用于训练Generative Adversarial Network (GAN)模型，以生成稳定的、高质量的动漫脸图像。

数据集构建指南

获取游戏信息：通过SQL查询从Erogame Space获取游戏列表。
图像采集：使用基于Scrapy的爬虫从Getchu网站抓取游戏图像。
面部检测与裁剪：应用Libcascade Animeface算法检测并裁剪出动漫脸图像。
图像放大：使用Wifu2x将裁剪后的图像放大至128x128像素。

数据集限制

分辨率限制：本项目不提供超过128x128像素的高分辨率动漫脸图像。
多次放大警告：过度放大可能导致图像质量下降，影响GAN模型的训练效果。

数据集版本

编辑版本：该数据集是基于Jin, Y.的工作的编辑版本。

搜集汇总

数据集介绍

构建方式

该数据集的构建方式主要依赖于从Getchu网站上采集的电子游戏CG图像，并通过一系列自动化工具进行处理。首先，通过SQL查询从Erogame Space获取2013年之后发售的游戏信息，并保存相关HTML文件。随后，利用基于Scrapy的爬虫工具从Getchu网站抓取这些游戏的图像。接着，使用Libcascade Animeface工具检测并裁剪出图像中的动漫人脸，并通过Wifu2x工具将裁剪后的图像放大至128x128像素。整个过程确保了数据集的高质量和一致性。

特点

该数据集的主要特点在于其图像来源的稳定性和高质量。与通过爬虫从开放网站上收集的图像不同，该数据集的图像来源于电子游戏CG，这些图像具有较高的艺术质量和一致的特征。此外，数据集的构建过程中采用了多种自动化工具，确保了图像处理的高效性和准确性。然而，需要注意的是，过度放大图像可能会引入噪声和失真，影响最终的训练效果。

使用方法

使用该数据集时，用户可以通过遵循提供的构建指南，自行生成数据集。首先，用户需要在Erogame Space上执行SQL查询以获取游戏信息，并保存HTML文件。接着，使用Scrapy爬虫工具从Getchu网站抓取图像。然后，通过Libcascade Animeface工具检测并裁剪出人脸图像，并使用Wifu2x工具进行放大处理。整个过程需要用户具备一定的编程和图像处理知识，以确保数据集的正确生成和使用。

背景与挑战

背景概述

动漫人脸数据集（Anime Face Dataset）是由Jin, Y.等人基于其先前的工作[2]进行编辑和扩展的，旨在为生成对抗网络（GAN）模型提供高质量的动漫人脸图像。该数据集的创建源于对现有动漫图像数据集质量不稳定和多样性不足的观察，特别是通过网络爬虫从开放平台收集的图像往往存在显著的差异。为了解决这一问题，研究人员从Getchu网站上收集了2013年之后发布的游戏中的高质量CG图像，这些图像具有稳定的特征和较高的质量，非常适合用于训练GAN模型。该数据集的构建过程包括图像采集、人脸检测与裁剪、图像缩放等步骤，最终生成了超过8000张动漫人脸图像，为动漫角色生成领域的研究提供了重要的资源。

当前挑战

动漫人脸数据集在构建过程中面临多项挑战。首先，图像质量的稳定性是一个关键问题，由于原始图像来源多样，图像质量参差不齐，可能导致模型训练效果不佳。其次，图像缩放过程中引入的噪声和“折叠线”问题，尤其是在多次缩放后，可能会导致图像细节丢失，进而影响GAN模型的训练效果。此外，数据集缺乏元信息，用户需要借助外部工具如Illustration2Vec[1]来估计图像特征，增加了数据处理的复杂性。最后，该数据集不适合需要高分辨率（超过128*128像素）动漫人脸图像的用户，限制了其在某些应用场景中的适用性。

常用场景

经典使用场景

在生成对抗网络（GAN）的研究领域中，Anime Face Dataset 被广泛用于训练和验证模型，以生成高质量的动漫人脸图像。该数据集通过从游戏CG中提取的图像构建，确保了图像质量的稳定性和一致性。研究者们常利用此数据集进行GAN模型的训练，以探索生成动漫角色面部特征的多样性和逼真度。

解决学术问题

该数据集解决了在生成高质量动漫人脸图像时，传统方法依赖于从网站爬取的图像所导致的质量不稳定和多样性不足的问题。通过从游戏CG中提取图像，Anime Face Dataset 提供了高质量且特征一致的图像，为研究者提供了一个理想的实验平台，推动了GAN在动漫图像生成领域的应用和发展。

衍生相关工作

基于Anime Face Dataset，研究者们开发了多种GAN模型，如StyleGAN的变体，用于生成高质量的动漫人脸图像。此外，该数据集还启发了在图像处理领域的相关研究，如图像超分辨率技术和图像去噪技术。这些衍生工作进一步推动了动漫图像生成技术的发展，并在学术界和工业界产生了深远的影响。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集