five

Anime Face Dataset|动漫脸谱生成数据集|图像识别数据集

收藏
github2024-05-07 更新2024-05-31 收录
动漫脸谱生成
图像识别
下载链接:
https://github.com/SiskonEmilia/Anime-Wifu-Dataset
下载链接
链接失效反馈
资源简介:
这是一个用于生成动漫脸谱数据集的工具包。默认设置下,可以生成超过8000张图像样本。该数据集本身不包含元信息,但用户可以使用Illustration2Vec等工具自行估计。数据集是从视频游戏中的CG图像中提取的,以确保图像质量稳定且高质量。

This is a toolkit designed for generating anime facial datasets. Under default settings, it can produce over 8,000 image samples. The dataset itself does not include metadata, but users can estimate it using tools such as Illustration2Vec. The images in the dataset are extracted from CG images in video games to ensure stable and high-quality image output.
创建时间:
2019-05-21
原始信息汇总

Anime Face Dataset 概述

数据集描述

  • 生成工具:该数据集是通过一个工具包生成的,默认设置下可生成超过8000张动漫脸图像样本。
  • 图像来源:图像主要从Getchu收集,筛选自2013年以后发布的游戏CG。
  • 图像处理:使用Libcascade Animeface进行面部检测和裁剪,并通过Wifu2x将图像放大至128x128像素。
  • 注意事项:不建议对图像进行超过两次的放大处理,以避免引入噪声和模糊轮廓。

数据集用途

  • 生成高质量动漫脸图像:用于训练Generative Adversarial Network (GAN)模型,以生成稳定的、高质量的动漫脸图像。

数据集构建指南

  1. 获取游戏信息:通过SQL查询从Erogame Space获取游戏列表。
  2. 图像采集:使用基于Scrapy的爬虫从Getchu网站抓取游戏图像。
  3. 面部检测与裁剪:应用Libcascade Animeface算法检测并裁剪出动漫脸图像。
  4. 图像放大:使用Wifu2x将裁剪后的图像放大至128x128像素。

数据集限制

  • 分辨率限制:本项目不提供超过128x128像素的高分辨率动漫脸图像。
  • 多次放大警告:过度放大可能导致图像质量下降,影响GAN模型的训练效果。

数据集版本

  • 编辑版本:该数据集是基于Jin, Y.的工作的编辑版本。
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建方式主要依赖于从Getchu网站上采集的电子游戏CG图像,并通过一系列自动化工具进行处理。首先,通过SQL查询从Erogame Space获取2013年之后发售的游戏信息,并保存相关HTML文件。随后,利用基于Scrapy的爬虫工具从Getchu网站抓取这些游戏的图像。接着,使用Libcascade Animeface工具检测并裁剪出图像中的动漫人脸,并通过Wifu2x工具将裁剪后的图像放大至128x128像素。整个过程确保了数据集的高质量和一致性。
特点
该数据集的主要特点在于其图像来源的稳定性和高质量。与通过爬虫从开放网站上收集的图像不同,该数据集的图像来源于电子游戏CG,这些图像具有较高的艺术质量和一致的特征。此外,数据集的构建过程中采用了多种自动化工具,确保了图像处理的高效性和准确性。然而,需要注意的是,过度放大图像可能会引入噪声和失真,影响最终的训练效果。
使用方法
使用该数据集时,用户可以通过遵循提供的构建指南,自行生成数据集。首先,用户需要在Erogame Space上执行SQL查询以获取游戏信息,并保存HTML文件。接着,使用Scrapy爬虫工具从Getchu网站抓取图像。然后,通过Libcascade Animeface工具检测并裁剪出人脸图像,并使用Wifu2x工具进行放大处理。整个过程需要用户具备一定的编程和图像处理知识,以确保数据集的正确生成和使用。
背景与挑战
背景概述
动漫人脸数据集(Anime Face Dataset)是由Jin, Y.等人基于其先前的工作[2]进行编辑和扩展的,旨在为生成对抗网络(GAN)模型提供高质量的动漫人脸图像。该数据集的创建源于对现有动漫图像数据集质量不稳定和多样性不足的观察,特别是通过网络爬虫从开放平台收集的图像往往存在显著的差异。为了解决这一问题,研究人员从Getchu网站上收集了2013年之后发布的游戏中的高质量CG图像,这些图像具有稳定的特征和较高的质量,非常适合用于训练GAN模型。该数据集的构建过程包括图像采集、人脸检测与裁剪、图像缩放等步骤,最终生成了超过8000张动漫人脸图像,为动漫角色生成领域的研究提供了重要的资源。
当前挑战
动漫人脸数据集在构建过程中面临多项挑战。首先,图像质量的稳定性是一个关键问题,由于原始图像来源多样,图像质量参差不齐,可能导致模型训练效果不佳。其次,图像缩放过程中引入的噪声和“折叠线”问题,尤其是在多次缩放后,可能会导致图像细节丢失,进而影响GAN模型的训练效果。此外,数据集缺乏元信息,用户需要借助外部工具如Illustration2Vec[1]来估计图像特征,增加了数据处理的复杂性。最后,该数据集不适合需要高分辨率(超过128*128像素)动漫人脸图像的用户,限制了其在某些应用场景中的适用性。
常用场景
经典使用场景
在生成对抗网络(GAN)的研究领域中,Anime Face Dataset 被广泛用于训练和验证模型,以生成高质量的动漫人脸图像。该数据集通过从游戏CG中提取的图像构建,确保了图像质量的稳定性和一致性。研究者们常利用此数据集进行GAN模型的训练,以探索生成动漫角色面部特征的多样性和逼真度。
解决学术问题
该数据集解决了在生成高质量动漫人脸图像时,传统方法依赖于从网站爬取的图像所导致的质量不稳定和多样性不足的问题。通过从游戏CG中提取图像,Anime Face Dataset 提供了高质量且特征一致的图像,为研究者提供了一个理想的实验平台,推动了GAN在动漫图像生成领域的应用和发展。
衍生相关工作
基于Anime Face Dataset,研究者们开发了多种GAN模型,如StyleGAN的变体,用于生成高质量的动漫人脸图像。此外,该数据集还启发了在图像处理领域的相关研究,如图像超分辨率技术和图像去噪技术。这些衍生工作进一步推动了动漫图像生成技术的发展,并在学术界和工业界产生了深远的影响。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

OECD - Education at a Glance

该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。

www.oecd.org 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

Med-MAT

Med-MAT是一个包含106个开源医学数据集的视觉问答(VQA)数据集,旨在推动医学多模态大语言模型(MLLMs)的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式,展示了组合泛化(CG)是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务(MAT)分类的子集的问答对,以及部分数据集的图像下载链接。

huggingface 收录