CyberHarem/atalanta_fgo
收藏Hugging Face2024-03-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/atalanta_fgo
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是关于《Fate/Grand Order》中的角色阿塔兰忒(Atalanta)的图像数据集,包含500张图像及其标签。数据集的核心标签包括`animal_ears, green_hair, long_hair, cat_ears, multicolored_hair, green_eyes, ahoge, blonde_hair, two-tone_hair, breasts, tail, gradient_hair, cat_tail, braid`。图像从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队提供。数据集提供了不同尺寸和裁剪方式的图像包,并支持通过waifuc工具加载原始数据集。
本数据集为《Fate/Grand Order》中角色阿塔兰忒(Atalanta)的图像数据集,共收录500张图像及其配套标签。数据集核心标签包括:兽耳(animal_ears)、绿发(green_hair)、长发(long_hair)、猫耳(cat_ears)、多色发色(multicolored_hair)、绿眸(green_eyes)、呆毛(ahoge)、金发(blonde_hair)、双色发色(two-tone_hair)、胸部(breasts)、尾巴(tail)、渐变发色(gradient_hair)、猫尾(cat_tail)、编发(braid)。图像源自danbooru、pixiv、zerochan等多个平台,爬取系统由DeepGHS团队提供。数据集提供了包含不同尺寸与裁剪方式的图像分发包,并支持通过waifuc工具加载原始数据集。
提供机构:
CyberHarem
原始信息汇总
数据集概述
数据集信息
- 名称: Dataset of atalanta/アタランテ/阿塔兰忒 (Fate/Grand Order)
- 描述: 包含500张图像及其标签,关于角色atalanta/アタランテ/阿塔兰忒 (Fate/Grand Order)。
- 核心标签:
animal_ears, green_hair, long_hair, cat_ears, multicolored_hair, green_eyes, ahoge, blonde_hair, two-tone_hair, breasts, tail, gradient_hair, cat_tail, braid
数据集包
| 名称 | 图像数量 | 大小 | 类型 | 描述 |
|---|---|---|---|---|
| raw | 500 | 649.08 MiB | Waifuc-Raw | 原始数据,包含元信息(最小边对齐到1400像素,如果更大)。 |
| 1200 | 500 | 581.89 MiB | IMG+TXT | 短边不超过1200像素的数据集。 |
| stage3-p480-1200 | 1186 | 1.06 GiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素。 |
标签聚类结果
原始文本版本
| # | 样本数 | 图像示例 | 标签 |
|---|---|---|---|
| 0 | 17 | ![]() |
1girl, dress, solo, black_gloves, puffy_short_sleeves, holding_bow_(weapon), looking_at_viewer, white_background, black_thighhighs, simple_background |
| 1 | 7 | ![]() |
1girl, solo, thighhighs, gloves, bow_(weapon), dress, thigh_boots |
| 2 | 14 | ![]() |
black_panties, 1girl, blush, black_bra, looking_at_viewer, underwear_only, black_thighhighs, solo, ass, garter_belt, small_breasts, from_behind, looking_back, simple_background, white_background, collarbone, navel |
| 3 | 5 | ![]() |
1girl, bare_shoulders, black_bikini, looking_at_viewer, solo, blush, collarbone, navel, side-tie_bikini_bottom, cleavage, micro_bikini, simple_background, white_background, armpits, covered_nipples, medium_breasts, small_breasts |
| 4 | 6 | ![]() |
1girl, beach, blue_sky, day, looking_at_viewer, ocean, outdoors, solo, cloud, navel, bare_shoulders, blush, collarbone, green_bikini, cleavage, small_breasts, wet |
| 5 | 9 | ![]() |
1girl, looking_at_viewer, solo, long_sleeves, alternate_costume, smile, bag, green_jacket, pleated_skirt, very_long_hair, black_skirt, hood, closed_mouth, socks, white_shirt |
| 6 | 16 | ![]() |
1girl, blush, solo, animal_ear_fluff, navel, collarbone, completely_nude, closed_mouth, very_long_hair, hair_between_eyes, large_breasts, nipples, stomach, closed_eyes, indoors, wet, fox_ears, thighs, cowboy_shot, facing_viewer, looking_at_viewer, pussy_juice, standing, thigh_gap |
表格版本
| # | 样本数 | 图像示例 | 1girl | dress | solo | black_gloves | puffy_short_sleeves | holding_bow_(weapon) | looking_at_viewer | white_background | black_thighhighs | simple_background | thighhighs | gloves | bow_(weapon) | thigh_boots | black_panties | blush | black_bra | underwear_only | ass | garter_belt | small_breasts | from_behind | looking_back | collarbone | navel | bare_shoulders | black_bikini | side-tie_bikini_bottom | cleavage | micro_bikini | armpits | covered_nipples | medium_breasts | beach | blue_sky | day | ocean | outdoors | cloud | green_bikini | wet | long_sleeves | alternate_costume | smile | bag | green_jacket | pleated_skirt | very_long_hair | black_skirt | hood | closed_mouth | socks | white_shirt | animal_ear_fluff | completely_nude | hair_between_eyes | large_breasts | nipples | stomach | closed_eyes | indoors | fox_ears | thighs | cowboy_shot | facing_viewer | pussy_juice | standing | thigh_gap |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 17 | ![]() |
X | X | X | X | X | X | X | X | X | X | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 1 | 7 | ![]() |
X | X | X | X | X | X | X | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 2 | 14 | ![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||||||||||||||||||||||||||||||||||||
| 3 | 5 | ![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||||||||||||||||||||||||||||||||||||
| 4 | 6 | ![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||||||||||||||||||||||||||||||||||||
| 5 | 9 | ![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||||||||||||||||||||||||||||||||||||||
| 6 | 16 | ![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X |
搜集汇总
数据集介绍

构建方式
在动漫角色图像数据集的构建领域,CyberHarem/atalanta_fgo数据集聚焦于《Fate/Grand Order》中的角色阿塔兰忒,其构建过程体现了系统化数据采集与处理的严谨性。该数据集通过自动化爬虫系统,从Danbooru、Pixiv、Zerochan等多个知名动漫艺术平台广泛搜集原始图像,确保了数据来源的多样性与代表性。在数据处理阶段,团队对图像进行了标准化预处理,包括尺寸调整与核心标签修剪,例如移除了动物耳朵、绿色长发等角色固有特征标签,以优化数据质量。最终形成的三个数据包分别提供原始数据、尺寸限制版本及多阶段裁剪版本,满足了不同研究场景下对图像分辨率与标注格式的需求。
特点
该数据集在动漫角色图像生成任务中展现出鲜明的专业特性。其核心在于围绕单一角色阿塔兰忒构建了高纯度图像集合,共包含500幅图像,每幅均配有经过筛选的文本标签,为基于文本的图像生成模型提供了精准的监督信号。数据集提供了多种预处理版本,如将短边限制在1200像素内的版本以及经过三阶段裁剪、确保最小区域面积的版本,这为模型训练中的多尺度学习与数据增强策略提供了便利。尤为突出的是,数据集附带了基于标签的聚类分析结果,通过可视化样本展示了不同服饰、场景下的角色形态,为理解角色视觉特征的分布规律提供了直观依据。
使用方法
针对该数据集的应用,研究者可根据具体任务选择相应的数据包进行加载。对于需要完整元信息的研究,可通过提供的Python代码,利用Waifuc工具加载原始压缩包,从而获取每幅图像的标签等元数据。若直接用于训练文本到图像生成模型,则可下载IMG+TXT格式的预处理版本,其中图像已调整至适宜尺寸并配有对应文本描述。数据集中包含的聚类表格可用于分析角色视觉模式的多样性,辅助数据筛选或评估生成结果的覆盖度。整个使用流程依托Hugging Face平台,确保了数据获取的便捷性与可复现性。
背景与挑战
背景概述
在数字艺术与生成式人工智能蓬勃发展的背景下,角色特异性图像数据集成为驱动风格化文本到图像生成模型的关键资源。CyberHarem/atalanta_fgo数据集聚焦于《Fate/Grand Order》中的角色阿塔兰忒,由DeepGHS团队构建,收录了500幅来自Danbooru、Pixiv等平台的精选图像及其标注。该数据集旨在为动漫风格角色生成提供高质量、高精度的训练样本,通过精细的标签修剪与多尺度图像处理,支持生成模型在保持角色核心视觉特征的前提下实现多样化输出,对二次元内容生成领域的研究与应用具有重要价值。
当前挑战
该数据集致力于解决动漫角色图像生成中风格一致性与特征保真度的核心挑战,要求模型在复杂姿态、服饰与场景下准确捕捉角色的标志性属性,如异色瞳、兽耳等细节。在构建过程中,面临多重挑战:一是数据源的异构性,需从多个社区平台爬取图像并统一标注规范,确保标签的准确性与一致性;二是内容敏感度管理,需在保留艺术多样性的同时过滤不适宜内容,平衡数据集的可用性与合规性;三是图像质量的标准化,通过多阶段裁剪与分辨率调整优化数据规模与模型训练效率,但可能引入信息损失或偏差。
常用场景
经典使用场景
在动漫艺术与生成式人工智能的交汇领域,CyberHarem/atalanta_fgo数据集为文本到图像生成任务提供了高度结构化的视觉素材。该数据集聚焦于《Fate/Grand Order》中的角色阿塔兰忒,收录了500张经过精细标注的图像,涵盖了从常规服饰到特定主题装扮的多种视觉形态。研究者通常利用此类数据集训练或微调生成模型,以实现对特定动漫角色在多场景下的高保真图像合成,尤其在控制角色属性、姿态与风格一致性方面展现出重要价值。
解决学术问题
该数据集针对生成式人工智能中细粒度角色控制与多模态对齐的学术挑战提供了解决方案。通过提供带有丰富语义标签的角色专属图像集合,它助力于解决文本引导图像生成中存在的属性绑定模糊、风格迁移不稳定等问题。其意义在于为动漫风格生成研究建立了可重复的基准数据,推动了可控生成技术在数字艺术创作领域的理论进展与方法创新,为个性化内容生成奠定了数据基础。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在动漫风格生成模型的优化与扩展。例如,基于此类角色特定数据集的LoRA微调方法研究,实现了对预训练扩散模型的高效个性化适配。同时,在标签语义解耦、跨姿态角色一致性生成以及少样本动漫角色学习等领域,该数据集常被用作验证新算法有效性的关键测试平台,催生了一系列关于可控图像生成与领域自适应技术的前沿学术成果。
以上内容由遇见数据集搜集并总结生成










