five

CyberHarem/mizuki_pokemon

收藏
Hugging Face2024-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/mizuki_pokemon
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为mizuki (Pokémon)的数据集,包含500张图片及其标签。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队提供支持。数据集的核心标签包括black_hair, short_hair, bangs, hat, red_headwear, eyelashes,这些标签在数据集中被修剪。数据集提供了多个版本,包括原始数据、不同分辨率的图片数据集以及经过裁剪的数据集。此外,还提供了如何使用waifuc加载原始数据集的代码示例,以及标签聚类结果的列表。

This is a dataset named Mizuki (Pokémon) consisting of 500 images and their associated labels. The images were crawled from multiple websites including Danbooru, Pixiv, Zerochan, and others, with the crawling system powered by the DeepGHS Team. Core labels of the dataset are black_hair, short_hair, bangs, hat, red_headwear, and eyelashes, and these labels have been pruned in the dataset. Multiple variants of the dataset are provided, including the original raw data, image datasets with different resolutions, and cropped datasets. Additionally, code examples for loading the raw dataset via waifuc, as well as a list of label clustering results, are provided.
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集信息

  • 名称: Dataset of mizuki (Pokémon)
  • 许可: MIT
  • 任务类别: text-to-image
  • 标签: art, not-for-all-audiences
  • 大小类别: n<1K

数据集内容

  • 图像数量: 500
  • 核心标签: black_hair, short_hair, bangs, hat, red_headwear, eyelashes
  • 来源: 从多个网站爬取,如danbooru, pixiv, zerochan等

数据包列表

名称 图像数量 大小 类型 描述
raw 500 459.97 MiB Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)
800 500 295.95 MiB IMG+TXT 短边不超过800像素的数据集
stage3-p480-800 1067 590.61 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素
1200 500 421.39 MiB IMG+TXT 短边不超过1200像素的数据集
stage3-p480-1200 1067 802.05 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素

标签聚类结果

原始文本版本

# 样本数量 标签
0 11 1girl, beanie, floral_print, green_shorts, short_sleeves, tied_shirt, :d, bag, blush, open_mouth, t-shirt, yellow_shirt, bracelet, z-ring, tongue, poke_ball_(basic), upper_teeth_only, short_shorts, holding_poke_ball, pokemon_(creature), solo, blue_eyes, simple_background, white_background
1 7 1girl, beanie, blue_eyes, short_sleeves, simple_background, solo, white_background, yellow_shirt, blush, looking_at_viewer, tied_shirt, white_pupils, green_shorts, holding_poke_ball, poke_ball_(basic), open_mouth, smile, bag, closed_mouth, floral_print, upper_body
2 9 1girl, beanie, closed_mouth, green_shorts, short_sleeves, solo, yellow_shirt, floral_print, simple_background, grey_eyes, looking_at_viewer, short_shorts, tied_shirt, white_background, smile, blush, shoes, sitting
3 11 blush, large_breasts, nipples, black_eyes, heart-shaped_pupils, sweat, nude, open_mouth, 1girl, smile, 2girls, collarbone, grabbing, yuri, blonde_hair, breast_grab, hetero

表格版本

# 样本数量 1girl beanie floral_print green_shorts short_sleeves tied_shirt :d bag blush open_mouth t-shirt yellow_shirt bracelet z-ring tongue poke_ball_(basic) upper_teeth_only short_shorts holding_poke_ball pokemon_(creature) solo blue_eyes simple_background white_background looking_at_viewer white_pupils smile closed_mouth upper_body grey_eyes shoes sitting large_breasts nipples black_eyes heart-shaped_pupils sweat nude 2girls collarbone grabbing yuri blonde_hair breast_grab hetero
0 11 X X X X X X X X X X X X X X X X X X X X X X X X
1 7 X X X X X X X X X X X X X X X X X X X X X
2 9 X X X X X X X X X X X X X X X X X X
3 11 X X X X X X X X X X X X X X X X X
搜集汇总
数据集介绍
main_image_url
构建方式
在动漫角色图像数据集的构建领域,Mizuki Pokémon数据集的创建体现了系统化采集与标注的严谨流程。该数据集通过自动化爬虫系统,从Danbooru、Pixiv及Zerochan等多个知名动漫艺术平台,精心搜集了500幅以宝可梦角色Mizuki为主题的图像。在数据预处理阶段,原始图像经过尺寸标准化处理,确保最小边缘对齐至1400像素,同时剔除了角色的核心标签如黑色短发、刘海、帽子等,以优化后续模型训练的泛化能力。数据集进一步提供了多种分辨率版本,包括800像素短边限制及三阶段裁剪格式,展现了多层次的数据结构化设计。
特点
该数据集在动漫风格图像数据中展现出鲜明的专一性与丰富性。其核心特征在于聚焦单一角色Mizuki,确保了主题的一致性,同时通过多源平台采集,涵盖了多样化的艺术风格与构图。数据集提供了四种不同处理版本,从原始元数据包到不同像素规格的裁剪版本,满足了从基础研究到高分辨率生成的多元化需求。特别值得注意的是,数据集附带了详细的标签聚类分析,将图像按视觉特征自动分组,例如服装、表情及场景元素,为角色属性挖掘与风格迁移研究提供了结构化洞察。这种设计既保留了数据的原始艺术完整性,又增强了其在机器学习任务中的实用性。
使用方法
在计算机视觉与生成式人工智能的应用场景中,该数据集的使用展现出高度的灵活性与可扩展性。研究人员可通过Hugging Face Hub直接下载ZIP格式的数据包,涵盖从原始数据到预处理后的图像文本对。对于需要深度元数据访问的用户,可利用Waifuc工具加载原始数据集,通过Python代码提取图像及其关联标签,实现自动化流水线处理。数据集的不同分辨率版本适用于多种训练框架,例如低分辨率版本可用于快速原型验证,而高分辨率及裁剪版本则支持细节丰富的图像生成模型。此外,聚类结果表格为角色属性分析与条件生成任务提供了直观的语义指导,使数据集在风格学习与内容创作研究中具有广泛适用性。
背景与挑战
背景概述
在动漫艺术与生成式人工智能交叉领域,角色特定图像数据集的构建对于推动文本到图像生成技术的精细化发展具有重要意义。CyberHarem/mizuki_pokemon数据集由DeepGHS团队创建,专注于《宝可梦》系列中的角色“mizuki”,旨在为角色一致性图像生成提供高质量的标注数据。该数据集收录了500张从Danbooru、Pixiv等主流动漫艺术平台爬取的图像,并进行了系统的标签处理与多尺度裁剪,其核心价值在于通过结构化标签体系支持生成模型对特定角色特征的精准学习与再现。
当前挑战
该数据集致力于解决动漫角色图像生成中角色特征一致性与细节还原的挑战,尤其在处理复杂服饰、发型及配饰等视觉属性时,模型需克服特征混淆与风格迁移的困难。在构建过程中,面临多重挑战:从异构网络源爬取图像需应对版权差异与内容质量不均的问题;自动化标签系统在识别二次元艺术特有元素(如非真实瞳孔色彩、风格化服装)时存在语义鸿沟;多版本数据预处理中,保持图像美学质量与分辨率平衡亦需精细算法设计。
常用场景
经典使用场景
在动漫风格图像生成领域,该数据集作为特定角色视觉特征的标注集合,为文本到图像生成模型提供了精细化的训练素材。其经典使用场景集中于训练生成对抗网络或扩散模型,以学习如何根据文本标签精确合成具有一致外观特征的动漫角色图像,例如生成特定发型、服饰和配饰组合的角色形象。
解决学术问题
该数据集主要解决了动漫角色生成中细粒度属性控制与视觉一致性保持的学术难题。通过提供带有结构化标签的图像集合,它支持研究者探索条件图像生成中标签语义与像素级输出的对齐问题,对提升生成模型的可控性与保真度具有显著意义,推动了个性化内容生成技术的发展。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在改进基于标签的动漫图像生成架构上,例如对现有生成模型进行微调以实现更精准的风格迁移。相关研究也探索了利用此类细粒度数据集进行跨模态检索,或开发新的标签扩展方法,以增强模型对复杂角色属性的理解和生成能力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作