CyberHarem/hephaistion_fgo
收藏Hugging Face2024-03-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/hephaistion_fgo
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- text-to-image
tags:
- art
- not-for-all-audiences
size_categories:
- n<1K
---
# Dataset of hephaistion/ヘファイスティオン/赫费斯提翁 (Fate/Grand Order)
This is the dataset of hephaistion/ヘファイスティオン/赫费斯提翁 (Fate/Grand Order), containing 28 images and their tags.
The core tags of this character are `long_hair, breasts, braid, black_hair, large_breasts, blue_eyes`, which are pruned in this dataset.
Images are crawled from many sites (e.g. danbooru, pixiv, zerochan ...), the auto-crawling system is powered by [DeepGHS Team](https://github.com/deepghs)([huggingface organization](https://huggingface.co/deepghs)).
## List of Packages
| Name | Images | Size | Download | Type | Description |
|:-----------------|---------:|:----------|:-----------------------------------------------------------------------------------------------------------------|:-----------|:---------------------------------------------------------------------|
| raw | 28 | 34.66 MiB | [Download](https://huggingface.co/datasets/CyberHarem/hephaistion_fgo/resolve/main/dataset-raw.zip) | Waifuc-Raw | Raw data with meta information (min edge aligned to 1400 if larger). |
| 1200 | 28 | 28.66 MiB | [Download](https://huggingface.co/datasets/CyberHarem/hephaistion_fgo/resolve/main/dataset-1200.zip) | IMG+TXT | dataset with the shorter side not exceeding 1200 pixels. |
| stage3-p480-1200 | 55 | 52.84 MiB | [Download](https://huggingface.co/datasets/CyberHarem/hephaistion_fgo/resolve/main/dataset-stage3-p480-1200.zip) | IMG+TXT | 3-stage cropped dataset with the area not less than 480x480 pixels. |
### Load Raw Dataset with Waifuc
We provide raw dataset (including tagged images) for [waifuc](https://deepghs.github.io/waifuc/main/tutorials/installation/index.html) loading. If you need this, just run the following code
```python
import os
import zipfile
from huggingface_hub import hf_hub_download
from waifuc.source import LocalSource
# download raw archive file
zip_file = hf_hub_download(
repo_id='CyberHarem/hephaistion_fgo',
repo_type='dataset',
filename='dataset-raw.zip',
)
# extract files to your directory
dataset_dir = 'dataset_dir'
os.makedirs(dataset_dir, exist_ok=True)
with zipfile.ZipFile(zip_file, 'r') as zf:
zf.extractall(dataset_dir)
# load the dataset with waifuc
source = LocalSource(dataset_dir)
for item in source:
print(item.image, item.meta['filename'], item.meta['tags'])
```
## List of Clusters
List of tag clustering result, maybe some outfits can be mined here.
### Raw Text Version
| # | Samples | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | Tags |
|----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 0 | 6 |  |  |  |  |  | 1girl, midriff, navel, solo, bare_shoulders, detached_sleeves, fingerless_gloves, standing, full_body, hand_on_own_hip, simple_background, very_long_hair, black_gloves, black_skirt, black_thighhighs, boots, high_heels, miniskirt, pleated_skirt, single_braid, weapon, white_background |
| 1 | 9 |  |  |  |  |  | 1girl, bare_shoulders, looking_at_viewer, solo, smile, detached_sleeves, black_gloves, fingerless_gloves, upper_body |
### Table Version
| # | Samples | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | 1girl | midriff | navel | solo | bare_shoulders | detached_sleeves | fingerless_gloves | standing | full_body | hand_on_own_hip | simple_background | very_long_hair | black_gloves | black_skirt | black_thighhighs | boots | high_heels | miniskirt | pleated_skirt | single_braid | weapon | white_background | looking_at_viewer | smile | upper_body |
|----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------|:----------|:--------|:-------|:-----------------|:-------------------|:--------------------|:-----------|:------------|:------------------|:--------------------|:-----------------|:---------------|:--------------|:-------------------|:--------|:-------------|:------------|:----------------|:---------------|:---------|:-------------------|:--------------------|:--------|:-------------|
| 0 | 6 |  |  |  |  |  | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | | | |
| 1 | 9 |  |  |  |  |  | X | | | X | X | X | X | | | | | | X | | | | | | | | | | X | X | X |
提供机构:
CyberHarem
原始信息汇总
数据集概述:hephaistion/ヘファイスティオン/赫费斯提翁 (Fate/Grand Order)
数据集基本信息
- 名称:hephaistion/ヘファイスティオン/赫费斯提翁 (Fate/Grand Order)
- 包含内容:28张图像及其标签
- 核心标签:long_hair, breasts, braid, black_hair, large_breasts, blue_eyes
- 许可:MIT
- 任务类别:text-to-image
- 标签:art, not-for-all-audiences
- 大小类别:n<1K
数据集包列表
| 名称 | 图像数量 | 大小 | 下载链接 | 类型 | 描述 |
|---|---|---|---|---|---|
| raw | 28 | 34.66 MiB | 下载 | Waifuc-Raw | 原始数据,包含元信息(最小边对齐至1400像素,如果更大)。 |
| 1200 | 28 | 28.66 MiB | 下载 | IMG+TXT | 数据集,短边不超过1200像素。 |
| stage3-p480-1200 | 55 | 52.84 MiB | 下载 | IMG+TXT | 三阶段裁剪数据集,区域不小于480x480像素。 |
数据集加载示例
-
加载工具:waifuc
-
加载代码示例: python import os import zipfile from huggingface_hub import hf_hub_download from waifuc.source import LocalSource
zip_file = hf_hub_download( repo_id=CyberHarem/hephaistion_fgo, repo_type=dataset, filename=dataset-raw.zip, ) dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir) source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])
数据集标签聚类列表
聚类列表(表格形式)
| # | 样本数量 | 图像示例 | 标签(部分) |
|---|---|---|---|
| 0 | 6 | 见链接 | 1girl, midriff, navel, solo, bare_shoulders, detached_sleeves, fingerless_gloves, standing, full_body, hand_on_own_hip, simple_background, very_long_hair, black_gloves, black_skirt, black_thighhighs, boots, high_heels, miniskirt, pleated_skirt, single_braid, weapon, white_background |
| 1 | 9 | 见链接 | 1girl, bare_shoulders, looking_at_viewer, solo, smile, detached_sleeves, black_gloves, fingerless_gloves, upper_body |
搜集汇总
数据集介绍

构建方式
在数字艺术与动漫角色生成领域,数据集的构建质量直接影响模型训练的效果。本数据集聚焦于《Fate/Grand Order》中的赫费斯提翁角色,通过自动化爬虫系统从Danbooru、Pixiv、Zerochan等多个知名艺术社区采集原始图像,并经过精心筛选与处理。采集过程中,系统对图像进行了尺寸标准化处理,确保长边对齐至1400像素以内,同时移除了角色的核心标签,如长发、胸部等特征,以提供更为纯净的数据基础。此外,数据集还提供了经过多阶段裁剪的版本,确保图像区域不低于480×480像素,为不同精度的训练需求提供了灵活选择。
特点
该数据集以其高度专业化的内容与精细的结构设计脱颖而出。它包含了28幅高质量图像,每幅均配有详细的元数据标签,涵盖了从服装细节到姿态特征的丰富描述,例如“单马尾”、“黑色手套”等。数据集通过聚类分析将图像分为不同组别,如全身像与上半身特写,便于用户针对特定视觉风格进行模型微调。其多版本格式设计,包括原始数据、尺寸限制版本及裁剪版本,满足了从基础研究到高精度生成任务的不同需求,体现了在动漫角色生成领域的数据处理深度。
使用方法
为支持高效的模型训练与应用,本数据集提供了多样化的加载方式。用户可通过Hugging Face Hub直接下载压缩包,解压后使用标准图像处理工具进行访问。对于高级应用,推荐利用Waifuc库加载原始数据集,该库支持从本地目录读取图像及其元标签,实现数据流的无缝集成。在具体使用中,开发者可根据任务需求选择不同版本:若需完整元信息,可选用原始版本;而针对训练效率,裁剪版本则能优化计算资源。这种设计确保了数据集在文本到图像生成、角色风格迁移等任务中的即插即用性。
背景与挑战
背景概述
在数字艺术与生成式人工智能蓬勃发展的时代,针对特定风格角色的高质量图像数据需求日益增长。CyberHarem/hephaistion_fgo数据集应运而生,专注于收录来自流行游戏《Fate/Grand Order》中的角色赫费斯提翁的二次创作图像。该数据集由DeepGHS团队构建,依托自动化爬取系统,从Danbooru、Pixiv等主流艺术社区采集了28幅标注图像,旨在为文本到图像的生成模型提供精细的角色特征学习素材。其创建不仅满足了同人艺术社区对特定角色数据集的迫切需求,也为动漫风格图像的生成与识别研究提供了宝贵的专项资源。
当前挑战
该数据集致力于解决动漫风格角色图像生成中的细粒度特征控制问题,其核心挑战在于如何从海量且风格各异的二次创作中,精准提取并标注一致的角色属性标签,以确保生成模型能准确学习到角色的标志性特征。在构建过程中,面临多重挑战:一是源图像的艺术风格与质量差异显著,需通过智能裁剪与尺寸归一化进行标准化处理;二是标签体系的构建需平衡语义丰富性与噪声控制,例如对核心标签进行剪枝以提升数据纯度;三是数据规模相对有限,可能制约模型在复杂姿态与场景下的泛化能力,需通过多阶段裁剪等数据增强策略予以缓解。
常用场景
经典使用场景
在动漫艺术与计算机视觉交叉领域,该数据集作为文本到图像生成任务的典型资源,聚焦于特定动漫角色赫费斯提翁的视觉特征建模。其经典应用场景在于为生成对抗网络(GAN)或扩散模型提供高质量、带标签的动漫风格图像,支持角色一致性生成研究,助力模型学习从文本描述到精细视觉属性的映射过程,尤其在二次元角色生成中展现其价值。
实际应用
在实际应用中,该数据集服务于动漫游戏产业、同人创作平台以及个性化内容生成工具。例如,在《Fate/Grand Order》等游戏的衍生创作中,开发者可利用该数据集训练定制化图像生成模型,自动化生成角色插图或宣传素材,提升内容生产效率;同时,也为动漫爱好者提供了基于角色特征的创意生成支持,丰富了二次元视觉内容的多样性。
衍生相关工作
围绕该数据集,衍生出多项经典研究工作,主要集中在动漫风格图像生成的算法改进上。例如,基于此类数据集的标签驱动生成模型,如标签条件生成对抗网络,被广泛应用于角色特定属性控制;同时,结合聚类分析技术,研究者探索了角色服饰与姿态的语义解耦方法,进一步推动了可控生成技术在动漫领域的应用与创新。
以上内容由遇见数据集搜集并总结生成



