Anime Face Dataset
收藏github2024-05-15 更新2024-05-31 收录
下载链接:
https://github.com/Mckinsey666/Anime-Face-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含63632张高质量动漫脸部图像的数据集,图像从www.getchu.com抓取,并使用https://github.com/nagadomi/lbpcascade_animeface中的动漫脸部检测算法进行裁剪。图像尺寸在90*90到120*120之间。与其他广泛使用的数据集(如danbooru数据集)相比,该数据集包含背景干净、色彩丰富的动漫角色图像。然而,数据集中仍存在少数异常值,如裁剪效果不佳的图像和非人类脸部图像。
This dataset comprises 63,632 high-quality anime facial images, which were scraped from www.getchu.com and cropped using an anime face detection algorithm available at https://github.com/nagadomi/lbpcascade_animeface. The image sizes range from 90*90 to 120*120 pixels. Compared to other widely used datasets, such as the danbooru dataset, this collection features anime character images with clean backgrounds and rich color palettes. However, the dataset still contains a few outliers, including poorly cropped images and non-human facial images.
创建时间:
2018-09-16
原始信息汇总
Anime Face Dataset 概述
数据集基本信息
- 名称: Anime Face Dataset
- 内容: 包含63632张高质量动漫面部图像,图像大小为90x90至120x120像素。
- 来源: 数据集从www.getchu.com网站上爬取,并使用https://github.com/nagadomi/lbpcascade_animeface中的算法进行面部裁剪。
数据集特点
- 质量: 相比其他常用数据集(如danbooru数据集),本数据集的图像背景干净,色彩丰富。
- 异常情况: 数据集中存在少数异常情况,包括裁剪不佳的结果和非人类面部。
数据集使用
- 目的: 仅供教育目的使用。
- 引用: 使用数据集时,请引用来源。
数据集更新
- 状态: 由于版权问题,数据集已设为私有。
- 替代方案: 提供爬虫和后处理脚本,用户可自行爬取数据。
- 未来计划: 作者正在开发新版本数据集,未来将仅发布爬取和后处理脚本。
数据集贡献
- 贡献方式: 欢迎添加类似质量的图像或图像标签。
源代码
- 可用性: 爬虫和面部检测代码已开源。
- 使用方法: 通过执行
python3 scrape.py和python3 detect.py命令,用户可以自行从网站爬取图片并进行面部检测。
引用格式
@online{chao2019/online, author = {Brian Chao}, title = {Anime Face Dataset: a collection of high-quality anime faces.}, date = {2019-09-16}, year = {2019}, url = {https://github.com/bchao1/Anime-Face-Dataset} }
搜集汇总
数据集介绍

构建方式
该数据集通过从www.getchu.com网站上抓取高质量的动漫角色图像,并利用anime face detection算法进行面部检测和裁剪,最终构建而成。图像尺寸在90 * 90至120 * 120像素之间,用户可根据需要进行缩放。整个构建过程包括网络爬虫抓取和面部检测两个主要步骤,确保了数据集的高质量和一致性。
特点
该数据集与其他常见的动漫图像数据集相比,具有显著的优势。其图像背景干净,色彩丰富,且包含高质量的动漫角色面部图像。尽管存在少数异常值,如裁剪不当或非人类面部图像,但整体质量较高。此外,数据集的多样性和规模使其在动漫图像生成和分析领域具有广泛的应用潜力。
使用方法
用户可以通过克隆GitHub仓库并运行提供的脚本来自行抓取和处理图像,图像将分别存储在`./src/images`和`./src/cropped`文件夹中。此外,数据集也可通过Kaggle平台获取。在使用该数据集进行项目或研究时,建议引用原始来源,以确保学术诚信和数据使用的合法性。
背景与挑战
背景概述
动漫人脸数据集(Anime Face Dataset)由Brian Chao于2019年创建,旨在为动漫人脸识别与生成研究提供高质量的图像资源。该数据集包含了从www.getchu.com网站上抓取的63,632张高质量动漫人脸图像,并通过动漫人脸检测算法进行裁剪,确保图像背景干净、色彩丰富。与广泛使用的danbooru数据集相比,该数据集在图像质量和结构上具有显著优势,尤其适用于生成对抗网络(GAN)等深度学习模型的训练与研究。该数据集的发布对动漫图像生成、人脸识别等领域产生了积极影响,成为相关研究的重要资源。
当前挑战
尽管动漫人脸数据集在图像质量和结构上具有优势,但其构建过程中仍面临若干挑战。首先,数据集的版权问题导致其无法公开分发,用户需自行抓取数据,增加了使用的复杂性。其次,数据集中存在少量异常值,如裁剪效果不佳或非人类面孔,这些异常值可能影响模型的训练效果。此外,数据集的图像尺寸不一致,用户在使用前需进行预处理,增加了额外的计算负担。未来,如何解决版权问题、提升数据集的纯净度以及标准化图像尺寸,将是该数据集进一步发展的关键挑战。
常用场景
经典使用场景
在动漫图像处理领域,Anime Face Dataset 因其高质量的动漫角色面部图像而备受瞩目。该数据集常用于训练和评估生成对抗网络(GAN)模型,特别是在动漫角色生成和风格迁移任务中。通过利用该数据集,研究者能够生成逼真的动漫角色面部图像,并探索不同风格之间的转换,从而推动动漫生成技术的发展。
解决学术问题
Anime Face Dataset 在解决动漫图像生成领域的学术问题中发挥了重要作用。其高质量的图像数据为研究者提供了丰富的素材,使得在生成对抗网络(GAN)、图像风格迁移等领域的研究得以深入。该数据集不仅提升了模型生成图像的质量,还为动漫图像生成的理论研究提供了实证支持,推动了相关领域的技术进步。
衍生相关工作
基于 Anime Face Dataset,众多研究者开展了深入的衍生工作。例如,有研究者利用该数据集开发了新的GAN模型,以生成更加逼真的动漫角色图像;还有研究者将其应用于图像风格迁移,探索不同动漫风格之间的转换。这些衍生工作不仅丰富了动漫图像生成领域的研究内容,还为相关技术的实际应用提供了新的思路。
以上内容由遇见数据集搜集并总结生成



