five

CyberHarem/daikokuten_fgo

收藏
Hugging Face2024-03-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/daikokuten_fgo
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为daikokuten/大黒天/大黑天 (Fate/Grand Order)的数据集,包含60张图片及其标签。图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬取系统由DeepGHS团队提供。数据集的核心标签包括`animal_ears, mouse_ears, mouse_girl, dark_skin, dark-skinned_female, short_hair, mouse_tail, red_eyes, tail, white_hair, maid_headdress`。此外,README还提供了数据集的下载链接、加载方法以及标签聚类结果的展示。

这是一个名为daikokuten/大黒天/大黑天 (Fate/Grand Order)的数据集,包含60张图片及其标签。图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬取系统由DeepGHS团队提供。数据集的核心标签包括`animal_ears, mouse_ears, mouse_girl, dark_skin, dark-skinned_female, short_hair, mouse_tail, red_eyes, tail, white_hair, maid_headdress`。此外,README还提供了数据集的下载链接、加载方法以及标签聚类结果的展示。
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集名称

Dataset of daikokuten/大黒天/大黑天 (Fate/Grand Order)

数据集描述

该数据集包含60张关于daikokuten/大黒天/大黑天(Fate/Grand Order)的图像及其标签。

核心标签

  • animal_ears
  • mouse_ears
  • mouse_girl
  • dark_skin
  • dark-skinned_female
  • short_hair
  • mouse_tail
  • red_eyes
  • tail
  • white_hair
  • maid_headdress

数据集包列表

名称 图像数量 大小 下载链接 类型 描述
raw 60 54.95 MiB Download Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。
1200 60 51.21 MiB Download IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 116 91.57 MiB Download IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

标签聚类结果

原始文本版本

# 样本数量 图像1 图像2 图像3 图像4 图像5 标签
0 14 long_sleeves, smile, white_apron, 1girl, looking_at_viewer, maid_apron, open_mouth, solo, simple_background, blush_stickers, full_body, grey_dress, red_ribbon, neck_ribbon
1 11 1girl, dress, white_apron, looking_at_viewer, nurse_cap, solo, white_background, hairclip, maid, long_sleeves, simple_background, smile, armband, blush_stickers, orange_eyes, twintails, upper_body

表格版本

# 样本数量 图像1 图像2 图像3 图像4 图像5 long_sleeves smile white_apron 1girl looking_at_viewer maid_apron open_mouth solo simple_background blush_stickers full_body grey_dress red_ribbon neck_ribbon dress nurse_cap white_background hairclip maid armband orange_eyes twintails upper_body
0 14 X X X X X X X X X X X X X X
1 11 X X X X X X X X X X X X X X X X X
搜集汇总
数据集介绍
main_image_url
构建方式
在动漫与游戏角色数据集的构建领域中,针对《Fate/Grand Order》中角色大黒天(daikokuten)的图像与标签数据,该数据集通过自动化爬取系统整合了Danbooru、Pixiv、Zerochan等多个平台的资源。系统由DeepGHS团队开发,共收录60张图像,并经过精心筛选与标注。核心标签如动物耳、鼠耳、鼠娘、深色皮肤、短发、红眼、尾巴、白发及女仆头饰等已被精简处理,以确保数据集的聚焦性与高质量。数据集以多种格式提供,包括原始元数据包及两种不同尺寸的压缩版本,便于后续处理与应用。
特点
该数据集最显著的特点在于其多模态与多尺度的组织方式。除了提供原始图像及其元信息外,还包含了短边不超过1200像素的标准化版本,以及经过三阶段裁剪、面积不小于480x480像素的增强数据集,共计116个样本。此外,数据集还提供了基于标签的聚类结果,以文本和表格两种形式呈现,揭示了角色在不同装束(如女仆装、护士装)下的视觉变体,为研究者深入理解角色特征分布提供了结构化的视角。
使用方法
使用者可通过Hugging Face Hub直接下载数据集压缩包。对于需要原始标签数据的场景,推荐使用waifuc库进行加载,通过简单的Python代码即可实现从本地解压目录读取图像及其对应标签。数据集兼容文本到图像生成任务,并遵循MIT许可协议,适合用于动漫角色生成模型的训练与评估。用户可根据需求选择raw、1200或stage3-p480-1200版本,灵活适配不同分辨率的实验要求。
背景与挑战
背景概述
该数据集由CyberHarem团队于近年创建,专注于《Fate/Grand Order》中角色“大黑天”(daikokuten)的图像与标签收集。作为一款面向文本到图像生成任务的数据集,它汇集了60张来自Danbooru、Pixiv、Zerochan等多源平台的图像,并配有精细化的特征标签,如动物耳、鼠耳、深色皮肤等。其核心研究问题在于为二次元角色生成提供高质量、结构化的训练数据,尤其针对具有复合视觉特征的动漫形象。该数据集依托DeepGHS团队开发的自动爬取系统构建,在动漫图像生成领域具有示范意义,为角色驱动的内容创作和模型微调提供了宝贵的基准资源。
当前挑战
该数据集面临的主要挑战包括:其一,领域问题层面,文本到图像生成任务对细粒度视觉特征与语义标签的对应关系要求极高,而动漫角色常包含复杂且重叠的装饰元素(如围裙、护士帽、发饰等),现有标签体系难以完全覆盖角色变体的多样性,易导致生成图像出现特征混淆或缺失。其二,构建过程中,图像来源的多样性虽丰富了内容,却带来了版权合规与质量一致性的难题;此外,数据集规模极小(仅60张图像),在训练生成模型时易引发过拟合,难以泛化至未见的姿态或场景,限制了其在真实应用中的鲁棒性。
常用场景
经典使用场景
该数据集专为文本到图像生成任务而设计,聚焦于Fate/Grand Order中的角色大黑天(daikokuten)。其经典使用场景在于为动漫风格的角色定制化生成模型提供高质量的标注图像集合,研究者可借助60张精心筛选的图像及其对应的核心标签(如动物耳、鼠耳、深色皮肤、女仆头饰等)训练或微调扩散模型与生成对抗网络,实现特定角色外貌与服饰元素的精准复现。
衍生相关工作
该数据集衍生出多项经典工作,包括基于Waifuc框架的图像爬取与预处理流程的标准化,以及标签聚类分析方法的创新应用。研究者进一步将其扩展为多阶段裁剪数据集(stage3-p480-1200),为图像修复与超分辨率任务提供训练样本;此外,围绕其核心标签体系,社区开发了角色特征解耦与组合生成模型,实现了跨角色元素(如服饰与发型)的迁移学习,推动了二次元角色生成领域的模块化研究。
数据集最近研究
最新研究方向
在二次元角色生成与个性化定制领域,数据集如CyberHarem/daikokuten_fgo正推动着文本到图像生成模型的精细化发展。该数据集聚焦于《Fate/Grand Order》中的角色“大黒天”,通过收录60张高标注密度的图像与核心标签(如兽耳、鼠尾、深色皮肤等),为少样本角色适配与概念注入提供了关键资源。当前前沿研究倾向于利用此类专精数据集进行扩散模型的条件微调,以提升对特定角色外观与服饰细节(如女仆围裙、护士帽等聚类特征)的生成保真度。此外,结合自动爬取与聚类分析技术,研究者可高效挖掘角色在不同画风下的潜在子概念,这对于游戏角色衍生创作、虚拟偶像定制等热点应用具有显著意义,进一步强化了数据集在可控生成与风格迁移中的基础支撑作用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作