CyberHarem/kako_azurlane
收藏Hugging Face2024-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/kako_azurlane
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- text-to-image
tags:
- art
- not-for-all-audiences
size_categories:
- n<1K
---
# Dataset of kako/加古/加古 (Azur Lane)
This is the dataset of kako/加古/加古 (Azur Lane), containing 12 images and their tags.
The core tags of this character are `braid, brown_hair, long_hair, glasses, semi-rimless_eyewear, twin_braids, under-rim_eyewear, red-framed_eyewear, animal_ears, breasts, large_breasts, aqua_eyes, bangs, between_breasts`, which are pruned in this dataset.
Images are crawled from many sites (e.g. danbooru, pixiv, zerochan ...), the auto-crawling system is powered by [DeepGHS Team](https://github.com/deepghs)([huggingface organization](https://huggingface.co/deepghs)).
## List of Packages
| Name | Images | Size | Download | Type | Description |
|:-----------------|---------:|:----------|:---------------------------------------------------------------------------------------------------------------|:-----------|:---------------------------------------------------------------------|
| raw | 12 | 8.63 MiB | [Download](https://huggingface.co/datasets/CyberHarem/kako_azurlane/resolve/main/dataset-raw.zip) | Waifuc-Raw | Raw data with meta information (min edge aligned to 1400 if larger). |
| 800 | 12 | 7.66 MiB | [Download](https://huggingface.co/datasets/CyberHarem/kako_azurlane/resolve/main/dataset-800.zip) | IMG+TXT | dataset with the shorter side not exceeding 800 pixels. |
| stage3-p480-800 | 25 | 13.78 MiB | [Download](https://huggingface.co/datasets/CyberHarem/kako_azurlane/resolve/main/dataset-stage3-p480-800.zip) | IMG+TXT | 3-stage cropped dataset with the area not less than 480x480 pixels. |
| 1200 | 12 | 8.38 MiB | [Download](https://huggingface.co/datasets/CyberHarem/kako_azurlane/resolve/main/dataset-1200.zip) | IMG+TXT | dataset with the shorter side not exceeding 1200 pixels. |
| stage3-p480-1200 | 25 | 14.50 MiB | [Download](https://huggingface.co/datasets/CyberHarem/kako_azurlane/resolve/main/dataset-stage3-p480-1200.zip) | IMG+TXT | 3-stage cropped dataset with the area not less than 480x480 pixels. |
### Load Raw Dataset with Waifuc
We provide raw dataset (including tagged images) for [waifuc](https://deepghs.github.io/waifuc/main/tutorials/installation/index.html) loading. If you need this, just run the following code
```python
import os
import zipfile
from huggingface_hub import hf_hub_download
from waifuc.source import LocalSource
# download raw archive file
zip_file = hf_hub_download(
repo_id='CyberHarem/kako_azurlane',
repo_type='dataset',
filename='dataset-raw.zip',
)
# extract files to your directory
dataset_dir = 'dataset_dir'
os.makedirs(dataset_dir, exist_ok=True)
with zipfile.ZipFile(zip_file, 'r') as zf:
zf.extractall(dataset_dir)
# load the dataset with waifuc
source = LocalSource(dataset_dir)
for item in source:
print(item.image, item.meta['filename'], item.meta['tags'])
```
## List of Clusters
List of tag clustering result, maybe some outfits can be mined here.
### Raw Text Version
| # | Samples | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | Tags |
|----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 0 | 12 |  |  |  |  |  | sailor_collar, 1girl, solo, pleated_skirt, crop_top, detached_sleeves, looking_at_viewer, neckerchief, retrofit_(azur_lane), black_skirt, midriff, closed_mouth, sleeveless_shirt, white_gloves, white_thighhighs, wide_sleeves, blush, miniskirt, navel, adjusting_eyewear, bare_shoulders, serafuku, simple_background |
### Table Version
| # | Samples | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | sailor_collar | 1girl | solo | pleated_skirt | crop_top | detached_sleeves | looking_at_viewer | neckerchief | retrofit_(azur_lane) | black_skirt | midriff | closed_mouth | sleeveless_shirt | white_gloves | white_thighhighs | wide_sleeves | blush | miniskirt | navel | adjusting_eyewear | bare_shoulders | serafuku | simple_background |
|----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:----------------|:--------|:-------|:----------------|:-----------|:-------------------|:--------------------|:--------------|:-----------------------|:--------------|:----------|:---------------|:-------------------|:---------------|:-------------------|:---------------|:--------|:------------|:--------|:--------------------|:-----------------|:-----------|:--------------------|
| 0 | 12 |  |  |  |  |  | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X |
提供机构:
CyberHarem
原始信息汇总
数据集概述
数据集信息
- 名称: Dataset of kako/加古/加古 (Azur Lane)
- 描述: 包含12张图片及其标签的数据集。
- 核心标签:
braid, brown_hair, long_hair, glasses, semi-rimless_eyewear, twin_braids, under-rim_eyewear, red-framed_eyewear, animal_ears, breasts, large_breasts, aqua_eyes, bangs, between_breasts - 标签分类结果: 包含一些服装的挖掘结果。
数据集包列表
| 名称 | 图片数量 | 大小 | 类型 | 描述 |
|---|---|---|---|---|
| raw | 12 | 8.63 MiB | Waifuc-Raw | 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。 |
| 800 | 12 | 7.66 MiB | IMG+TXT | 短边不超过800像素的数据集。 |
| stage3-p480-800 | 25 | 13.78 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素。 |
| 1200 | 12 | 8.38 MiB | IMG+TXT | 短边不超过1200像素的数据集。 |
| stage3-p480-1200 | 25 | 14.50 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素。 |
标签分类结果
原始文本版本
| # | 样本数量 | 图片1 | 图片2 | 图片3 | 图片4 | 图片5 | 标签 |
|---|---|---|---|---|---|---|---|
| 0 | 12 | ![]() |
![]() |
![]() |
![]() |
![]() |
sailor_collar, 1girl, solo, pleated_skirt, crop_top, detached_sleeves, looking_at_viewer, neckerchief, retrofit_(azur_lane), black_skirt, midriff, closed_mouth, sleeveless_shirt, white_gloves, white_thighhighs, wide_sleeves, blush, miniskirt, navel, adjusting_eyewear, bare_shoulders, serafuku, simple_background |
表格版本
| # | 样本数量 | 图片1 | 图片2 | 图片3 | 图片4 | 图片5 | sailor_collar | 1girl | solo | pleated_skirt | crop_top | detached_sleeves | looking_at_viewer | neckerchief | retrofit_(azur_lane) | black_skirt | midriff | closed_mouth | sleeveless_shirt | white_gloves | white_thighhighs | wide_sleeves | blush | miniskirt | navel | adjusting_eyewear | bare_shoulders | serafuku | simple_background |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 12 | ![]() |
![]() |
![]() |
![]() |
![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X |
搜集汇总
数据集介绍

构建方式
在动漫角色图像数据集的构建领域,CyberHarem/kako_azurlane数据集通过自动化爬虫技术,从Danbooru、Pixiv、Zerochan等多个知名艺术社区系统性地采集图像资源。该过程依托DeepGHS团队开发的先进爬取系统,确保数据来源的多样性与广泛性。原始图像经过预处理,将较长边对齐至1400像素以内,以维持视觉一致性,同时核心角色标签如'braid, brown_hair'等被精心修剪,以优化后续模型训练的标签质量。
使用方法
研究人员可通过HuggingFace Hub直接下载各版本压缩包,快速获取图像与文本标签对,适用于文本到图像生成模型的训练与评估。利用提供的Waifuc工具,用户能加载原始数据集,访问图像及其元数据标签,实现本地化处理与扩展分析。数据集的多格式设计允许根据计算需求选择适当分辨率,例如三阶段裁剪版本适用于注重细节保留的任务,为动漫艺术生成领域提供了可定制化的数据基础。
背景与挑战
背景概述
在动漫角色图像生成与标注领域,高质量、细粒度的数据集对于推动文本到图像生成模型的发展至关重要。CyberHarem/kako_azurlane数据集由DeepGHS团队构建,专注于《碧蓝航线》中的角色“加古”,旨在为角色特定风格的艺术创作提供结构化资源。该数据集通过自动化爬虫系统从多个知名艺术平台(如Danbooru、Pixiv等)收集图像,并辅以精炼的标签体系,体现了在二次元文化背景下对角色视觉特征进行系统性建模的学术尝试。其核心研究问题在于如何通过有限但高精度的样本,支持生成模型学习特定角色的细节属性,从而促进动漫风格图像生成技术的可控性与真实性。
当前挑战
该数据集面临的挑战主要体现在两个方面:在领域问题层面,动漫角色图像生成需克服风格一致性、细节还原度以及标签与视觉特征对齐的难题,尤其是针对特定角色如“加古”的复杂外观属性(如发型、服饰配件)的精确建模;在构建过程中,挑战包括从异构网络源爬取图像时确保数据质量与版权合规性,以及通过自动化流程处理大规模图像时对标签进行有效去噪与修剪,同时维持数据集的规模与多样性之间的平衡。
常用场景
经典使用场景
在动漫风格图像生成领域,CyberHarem/kako_azurlane数据集作为特定角色加古的视觉资料库,其经典使用场景聚焦于训练文本到图像的生成模型。通过提供角色加古的12张标注图像及精细的标签信息,该数据集能够支持生成对抗网络或扩散模型学习如何根据文本描述合成具有一致角色特征的动漫风格图像。这种应用不仅有助于模型理解角色属性与视觉表现之间的映射关系,还为个性化角色创作提供了数据基础。
解决学术问题
该数据集主要解决了动漫角色图像生成中数据稀缺与标注一致性的学术研究问题。通过提供高质量、标签统一的角色图像,它支持研究者探索少样本学习下的生成模型性能,以及标签对图像合成质量的影响机制。其意义在于为动漫风格生成任务建立了可复现的实验基准,推动了文本引导的图像生成技术在细分领域的精细化发展,并为角色一致性保持、属性控制等关键挑战提供了实证研究的数据支撑。
实际应用
在实际应用层面,CyberHarem/kako_azurlane数据集可服务于动漫内容创作、游戏角色设计及个性化数字艺术生成等领域。例如,游戏开发者可利用该数据集训练模型,快速生成角色加古在不同场景或服饰下的变体图像,以丰富游戏视觉内容。同时,该数据集也能辅助动漫爱好者或独立创作者进行同人作品创作,通过输入文本标签自动生成符合角色设定的高质量图像,提升创作效率与艺术表现力。
数据集最近研究
最新研究方向
在动漫风格图像生成领域,CyberHarem/kako_azurlane数据集作为《碧蓝航线》角色加古的专项图像集合,为角色一致性生成与精细化标签标注提供了关键资源。当前研究聚焦于利用此类小规模高质量数据集,探索少样本学习与迁移学习在二次元角色生成中的应用,旨在提升生成图像的细节保真度与风格一致性。同时,结合自动爬取与多源整合技术,该数据集支持跨平台图像特征的融合分析,推动了动漫艺术创作与计算机视觉在内容理解、风格迁移等前沿方向的交叉创新,为个性化角色生成系统的开发奠定了数据基础。
以上内容由遇见数据集搜集并总结生成








