CyberHarem/miriel_fireemblem
收藏Hugging Face2024-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/miriel_fireemblem
下载链接
链接失效反馈官方服务:
资源简介:
这是名为miriel (Fire Emblem)的数据集,包含89张图片及其标签。图片来源于多个网站,如danbooru、pixiv、zerochan等,并由DeepGHS团队的自动爬取系统收集。数据集的核心标签包括眼镜、短发、红发、帽子、女巫帽、胸部、大胸部、棕发、红眼等。此外,README还提供了不同版本数据集的下载链接和描述,包括原始数据、不同像素大小的数据集以及三阶段裁剪的数据集。最后,文件还介绍了如何使用waifuc工具加载原始数据集,并展示了标签聚类结果的示例。
这是名为miriel (Fire Emblem)的数据集,包含89张图片及其标签。图片来源于多个网站,如danbooru、pixiv、zerochan等,并由DeepGHS团队的自动爬取系统收集。数据集的核心标签包括眼镜、短发、红发、帽子、女巫帽、胸部、大胸部、棕发、红眼等。此外,README还提供了不同版本数据集的下载链接和描述,包括原始数据、不同像素大小的数据集以及三阶段裁剪的数据集。最后,文件还介绍了如何使用waifuc工具加载原始数据集,并展示了标签聚类结果的示例。
提供机构:
CyberHarem
原始信息汇总
数据集概述
基本信息
- 名称: Dataset of miriel (Fire Emblem)
- 许可证: MIT
- 任务类别: text-to-image
- 标签: art, not-for-all-audiences
- 大小类别: n<1K
数据集内容
- 图像数量: 89张
- 核心标签: glasses, short_hair, red_hair, hat, witch_hat, breasts, large_breasts, brown_hair, red_eyes
数据包列表
| 名称 | 图像数量 | 大小 | 类型 | 描述 |
|---|---|---|---|---|
| raw | 89 | 78.02 MiB | Waifuc-Raw | 原始数据,包含元信息(最小边对齐到1400像素,如果更大)。 |
| 800 | 89 | 48.96 MiB | IMG+TXT | 短边不超过800像素的数据集。 |
| stage3-p480-800 | 176 | 92.26 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素。 |
| 1200 | 89 | 71.25 MiB | IMG+TXT | 短边不超过1200像素的数据集。 |
| stage3-p480-1200 | 176 | 128.89 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素。 |
集群列表
原始文本版本
| # | 样本数量 | 图像示例 | 标签 |
|---|---|---|---|
| 0 | 14 | ![]() |
1girl, hetero, solo_focus, 1boy, nipples, uncensored, pussy, sex, nude, blush, spread_legs, clitoris, cum, large_penis, navel, vaginal |
| 1 | 44 | ![]() |
1girl, solo, book, cape, brown_eyes, simple_background, bridal_gauntlets |
表格版本
| # | 样本数量 | 图像示例 | 1girl | hetero | solo_focus | 1boy | nipples | uncensored | pussy | sex | nude | blush | spread_legs | clitoris | cum | large_penis | navel | vaginal | solo | book | cape | brown_eyes | simple_background | bridal_gauntlets |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 14 | ![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | ||||||
| 1 | 44 | ![]() |
X | X | X | X | X | X | X |
搜集汇总
数据集介绍

构建方式
在数字艺术与动漫角色研究领域,数据集的构建需兼顾来源多样性与内容规范性。该数据集围绕《火焰纹章》系列中的角色“Miriel”展开,通过自动化爬虫系统从Danbooru、Pixiv、Zerochan等多个知名艺术平台系统性地采集图像素材。原始图像经过预处理,确保长边对齐至1400像素以内,并剔除了角色核心标签(如眼镜、短发、红发等),以聚焦于多样化的视觉特征。最终形成包含89张图像及其对应标签的原始集合,体现了跨平台艺术内容的聚合与标准化处理。
特点
该数据集在动漫角色图像数据中展现出鲜明的结构化特色。其核心在于提供多版本图像包,涵盖不同分辨率(如800像素短边限制、1200像素短边限制)及裁剪策略(如三阶段裁剪确保最小480×480像素区域),满足多尺度模型训练需求。图像附有精细的元数据标签,并依据内容特征进行聚类分析,例如区分出包含书籍、披风等道具的日常场景与特定主题场景。这种分层设计不仅提升了数据的可用性,也为角色视觉表达的多样性研究提供了量化基础。
使用方法
针对文本到图像生成等计算机视觉任务,该数据集支持灵活的技术路径。用户可通过Hugging Face Hub直接下载预处理的图像-文本对(IMG+TXT格式),适配主流深度学习框架。对于需要原始元数据的研究,可利用配套的Waifuc工具加载本地解压后的数据,逐项访问图像及其标签信息。数据集中提供的聚类结果可辅助内容分析,例如识别角色在不同情境下的视觉模式,从而服务于风格迁移、角色生成或标签预测等具体应用场景。
背景与挑战
背景概述
在数字艺术与生成式人工智能蓬勃发展的时代,角色特异性图像数据集的构建成为推动文本到图像生成模型精细化发展的重要基石。CyberHarem/miriel_fireemblem数据集应运而生,由DeepGHS团队创建并维护,专注于汇聚源自《火焰之纹章》系列的角色“Miriel”的二次创作视觉资料。该数据集收录了89幅经过精选与标注的图像,核心研究问题在于为特定虚构角色建立高质量、多标签的视觉资源库,以支持个性化角色形象的生成与风格化研究,对动漫风格图像生成领域的模型训练与评估提供了宝贵的专项数据支撑。
当前挑战
该数据集致力于解决动漫风格角色图像生成中特定角色一致性建模的挑战,即如何让模型根据文本标签精确生成符合角色既定外观特征(如眼镜、红色头发、巫女帽等)的图像。在构建过程中,面临多重挑战:其一,数据采集需从Danbooru、Pixiv等多个异构平台进行网络爬取,确保图像质量与版权合规性存在难度;其二,原始图像标签体系庞杂,需进行核心特征标签的提取与修剪,以构建精炼且一致的标注;其三,为适应不同训练需求,需对图像进行多尺度(如800像素、1200像素)与多阶段裁剪处理,在保持图像内容完整性与视觉质量间寻求平衡。
常用场景
经典使用场景
在动漫风格图像生成领域,CyberHarem/miriel_fireemblem数据集作为特定角色米莉尔的视觉资料库,其经典使用场景集中于训练文本到图像的生成模型。该数据集通过提供高分辨率图像与精细标注的标签对,为模型学习角色特征与文本描述之间的映射关系奠定了数据基础。研究者可借助此类数据集,探索如何基于自然语言提示生成具有一致角色特征和多样化姿态的动漫图像,从而推动可控图像合成技术的发展。
实际应用
在实际应用中,该数据集能够服务于动漫内容创作、游戏美术资源生成以及个性化数字艺术设计等领域。创作者可利用基于此数据集训练的模型,快速生成特定游戏角色“米莉尔”的同人插图或衍生视觉内容,有效辅助概念设计、故事板绘制及粉丝创作,降低了高质量定制化动漫图像的生产门槛,并丰富了二次元文化生态的视觉表达。
衍生相关工作
围绕此类角色中心化数据集,衍生出诸多经典研究工作,主要集中在改进动漫风格生成模型的架构与训练策略上。例如,相关工作探索了如何利用标签聚类信息增强模型对角色不同装扮或场景的理解,或结合对抗生成网络与注意力机制来提升图像细节质量。这些研究进一步推动了标签驱动生成、少样本角色适应等方向的发展,并常被整合进更广泛的动漫图像生成框架中。
以上内容由遇见数据集搜集并总结生成





