five

huggan/anime-faces

收藏
Hugging Face2022-03-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/huggan/anime-faces
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc0-1.0 --- # Dataset Card for anime-faces ## Table of Contents - [Dataset Description](#dataset-description) - [Dataset Summary](#dataset-summary) - [Supported Tasks](#supported-tasks-and-leaderboards) - [Languages](#languages) - [Dataset Structure](#dataset-structure) - [Data Instances](#data-instances) - [Data Fields](#data-instances) - [Data Splits](#data-instances) - [Dataset Creation](#dataset-creation) - [Curation Rationale](#curation-rationale) - [Source Data](#source-data) - [Annotations](#annotations) - [Personal and Sensitive Information](#personal-and-sensitive-information) - [Considerations for Using the Data](#considerations-for-using-the-data) - [Social Impact of Dataset](#social-impact-of-dataset) - [Discussion of Biases](#discussion-of-biases) - [Other Known Limitations](#other-known-limitations) - [Additional Information](#additional-information) - [Dataset Curators](#dataset-curators) - [Licensing Information](#licensing-information) - [Citation Information](#citation-information) ## Dataset Description - **Homepage:** https://www.kaggle.com/soumikrakshit/anime-faces - **Repository:** https://www.kaggle.com/soumikrakshit/anime-faces - **Paper:** [Needs More Information] - **Leaderboard:** [Needs More Information] - **Point of Contact:** https://github.com/Mckinsey666 ### Dataset Summary This is a dataset consisting of 21551 anime faces scraped from www.getchu.com, which are then cropped using the anime face detection algorithm in https://github.com/nagadomi/lbpcascade_animeface. All images are resized to 64 * 64 for the sake of convenience. Please also cite the two sources when using this dataset. Some outliers are still present in the dataset: Bad cropping results Some non-human faces. Feel free to contribute to this dataset by adding images of similar quality or adding image labels. ### Supported Tasks and Leaderboards [Needs More Information] ### Languages [Needs More Information] ## Dataset Structure ### Data Instances [Needs More Information] ### Data Fields Has a data folder with png files inside. ### Data Splits Only training set ## Dataset Creation ### Curation Rationale [Needs More Information] ### Source Data #### Initial Data Collection and Normalization [Needs More Information] #### Who are the source language producers? [Needs More Information] ### Annotations #### Annotation process [Needs More Information] #### Who are the annotators? [Needs More Information] ### Personal and Sensitive Information [Needs More Information] ## Considerations for Using the Data ### Social Impact of Dataset [Needs More Information] ### Discussion of Biases [Needs More Information] ### Other Known Limitations [Needs More Information] ## Additional Information ### Dataset Curators [Needs More Information] ### Licensing Information [Needs More Information] ### Citation Information [Needs More Information] --- annotations_creators: - found language_creators: - found languages: - unknown licenses: - unknown multilinguality: - unknown pretty_name: anime-faces size_categories: - unknown source_datasets: - original task_categories: - image-classification task_ids: [] ---

许可证:CC0 1.0 # 动漫人脸数据集卡片 ## 目录 - [数据集描述](#dataset-description) - [数据集概览](#dataset-summary) - [支持任务与排行榜](#supported-tasks-and-leaderboards) - [语言情况](#languages) - [数据集结构](#dataset-structure) - [数据实例](#data-instances) - [数据字段](#data-fields) - [数据划分](#data-splits) - [数据集构建](#dataset-creation) - [构建初衷](#curation-rationale) - [源数据](#source-data) - [标注信息](#annotations) - [个人与敏感信息](#personal-and-sensitive-information) - [数据集使用注意事项](#considerations-for-using-the-data) - [数据集的社会影响](#social-impact-of-dataset) - [偏差说明](#discussion-of-biases) - [其他已知局限性](#other-known-limitations) - [附加信息](#additional-information) - [数据集维护者](#dataset-curators) - [许可信息](#licensing-information) - [引用信息](#citation-information) ## 数据集描述 - **主页**:https://www.kaggle.com/soumikrakshit/anime-faces - **代码仓库**:https://www.kaggle.com/soumikrakshit/anime-faces - **相关论文**:[需补充更多信息] - **排行榜**:[需补充更多信息] - **联系方式**:https://github.com/Mckinsey666 ### 数据集概览 本数据集包含从www.getchu.com网站爬取的21551张动漫人脸图像,使用https://github.com/nagadomi/lbpcascade_animeface 中的动漫人脸检测算法进行裁剪。为便于使用,所有图像均统一调整至64×64像素。使用本数据集时,请一并引用上述两个来源。 数据集内仍存在部分异常样本:包括裁剪效果不佳的图像,以及少量非人脸图像。欢迎贡献同质量的图像或图像标签以完善本数据集。 ### 支持任务与排行榜 [需补充更多信息] ### 语言情况 [需补充更多信息] ## 数据集结构 ### 数据实例 [需补充更多信息] ### 数据字段 数据集包含一个内含PNG格式图像文件的data文件夹。 ### 数据划分 仅包含训练集 ## 数据集构建 ### 构建初衷 [需补充更多信息] ### 源数据 #### 初始数据收集与归一化 [需补充更多信息] #### 源数据语言生产者: [需补充更多信息] ### 标注信息 #### 标注流程 [需补充更多信息] #### 标注者: [需补充更多信息] ### 个人与敏感信息 [需补充更多信息] ## 数据集使用注意事项 ### 数据集的社会影响 [需补充更多信息] ### 偏差说明 [需补充更多信息] ### 其他已知局限性 [需补充更多信息] ## 附加信息 ### 数据集维护者 [需补充更多信息] ### 许可信息 [需补充更多信息] ### 引用信息 [需补充更多信息] --- 标注创建者:发现式 语言创建者:发现式 语言:未知 许可证:未知 多语言特性:未知 展示名称:anime-faces 规模分类:未知 源数据集:原始数据集 任务类别:图像分类 任务子项:无
提供机构:
huggan
原始信息汇总

Dataset Card for anime-faces

Dataset Description

Dataset Summary

This dataset contains 21551 anime faces scraped from www.getchu.com and cropped using the anime face detection algorithm from https://github.com/nagadomi/lbpcascade_animeface. All images are resized to 64 * 64 pixels. The dataset includes some outliers such as bad cropping results and non-human faces. Contributions to the dataset are welcome.

Supported Tasks and Leaderboards

[Needs More Information]

Languages

[Needs More Information]

Dataset Structure

Data Instances

[Needs More Information]

Data Fields

The dataset includes a data folder containing PNG files.

Data Splits

The dataset only includes a training set.

Dataset Creation

Curation Rationale

[Needs More Information]

Source Data

Initial Data Collection and Normalization

[Needs More Information]

Who are the source language producers?

[Needs More Information]

Annotations

Annotation process

[Needs More Information]

Who are the annotators?

[Needs More Information]

Personal and Sensitive Information

[Needs More Information]

Considerations for Using the Data

Social Impact of Dataset

[Needs More Information]

Discussion of Biases

[Needs More Information]

Other Known Limitations

[Needs More Information]

Additional Information

Dataset Curators

[Needs More Information]

Licensing Information

[Needs More Information]

Citation Information

[Needs More Information]

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于对动漫网站www.getchu.com的爬虫抓取,共计21551张动漫面部图像。图像经过 anime face detection 算法进行裁剪,并统一调整至64x64像素大小,以便于后续处理。构建过程中,对图像质量进行了初步筛选,但仍存在裁剪效果不佳和非人类面部图像的异常值。
特点
anime-faces数据集的主要特点在于其专注于动漫面部图像的收集,适用于图像分类等视觉识别任务。数据集采用CC0协议,允许无限制使用,但建议在使用时引用相关来源。此外,数据集提供了丰富的样本数量,有助于模型的训练和评估。尽管存在一定比例的异常值,但整体质量较高,为研究提供了良好的基础。
使用方法
用户在使用该数据集时,应首先了解其结构和数据字段,数据集仅包含训练集。数据以png格式的图像文件存储在数据文件夹内。在使用前,用户可能需要对数据进行进一步的清洗和预处理,以排除异常值和提升模型性能。引用数据集时,应遵循CC0协议的要求,并注明数据来源。
背景与挑战
背景概述
anime-faces数据集是一个搜集自www.getchu.com的21551张动漫人脸的集合,通过特定的动漫人脸检测算法进行裁剪,并统一调整至64*64像素大小以便利后续处理。该数据集的创建旨在为动漫人脸相关的图像识别研究提供标准化资源,其创建时间虽不明确,但由数据集的维护者soumikrakshit在Kaggle平台上进行管理。该数据集的问世,为计算机视觉领域中的动漫角色识别、图像风格分析等研究提供了重要支撑,并对相关领域的学术探索和技术发展产生了积极影响。
当前挑战
尽管anime-faces数据集为相关研究领域提供了宝贵的资源,但在数据构建过程中亦面临诸多挑战。首先,数据集中存在不完美的裁剪结果和非人类面孔的图片,这为后续的图像分类和识别任务带来了困难。其次,数据集缺乏详细的标注信息,且未提供测试集,这限制了其在模型评估和公平性分析方面的应用。此外,数据集的多元性和包容性问题亦有待进一步探讨,以增强其在不同文化和性别群体中的代表性。
常用场景
经典使用场景
在计算机视觉研究领域,huggan/anime-faces数据集因其独特的图像内容而被广泛使用。该数据集包含了从www.getchu.com网站抓取的21551张动漫人脸图像,经过特定算法裁剪和尺寸标准化后,成为了面部识别、表情识别等任务的理想资源。
解决学术问题
该数据集解决了传统面部识别研究中对于非真实人脸图像处理的局限性问题,为研究者提供了一个丰富的、专注于动漫风格人脸的样本集。这对于改善算法对于不同人脸风格的理解和识别能力,具有重要的学术价值和深远的研究意义。
衍生相关工作
基于huggan/anime-faces数据集,衍生出了一系列相关的研究工作,包括但不限于动漫人脸的自动标注、特征提取以及跨领域的风格迁移等。这些工作进一步扩展了数据集的应用范围,促进了计算机视觉与动漫文化的融合。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作