five

CyberHarem/oyashio_azurlane

收藏
Hugging Face2024-01-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/oyashio_azurlane
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit task_categories: - text-to-image tags: - art - not-for-all-audiences size_categories: - n<1K --- # Dataset of oyashio/親潮/亲潮 (Azur Lane) This is the dataset of oyashio/親潮/亲潮 (Azur Lane), containing 12 images and their tags. The core tags of this character are `hair_ornament, hair_bun, x_hair_ornament, braid, bangs, fang, hair_between_eyes, horns, double_bun, blonde_hair, blue_eyes, pointy_ears, sidelocks, breasts, brown_hair`, which are pruned in this dataset. Images are crawled from many sites (e.g. danbooru, pixiv, zerochan ...), the auto-crawling system is powered by [DeepGHS Team](https://github.com/deepghs)([huggingface organization](https://huggingface.co/deepghs)). ## List of Packages | Name | Images | Size | Download | Type | Description | |:-----------------|---------:|:----------|:------------------------------------------------------------------------------------------------------------------|:-----------|:---------------------------------------------------------------------| | raw | 12 | 14.16 MiB | [Download](https://huggingface.co/datasets/CyberHarem/oyashio_azurlane/resolve/main/dataset-raw.zip) | Waifuc-Raw | Raw data with meta information (min edge aligned to 1400 if larger). | | 800 | 12 | 8.40 MiB | [Download](https://huggingface.co/datasets/CyberHarem/oyashio_azurlane/resolve/main/dataset-800.zip) | IMG+TXT | dataset with the shorter side not exceeding 800 pixels. | | stage3-p480-800 | 28 | 17.77 MiB | [Download](https://huggingface.co/datasets/CyberHarem/oyashio_azurlane/resolve/main/dataset-stage3-p480-800.zip) | IMG+TXT | 3-stage cropped dataset with the area not less than 480x480 pixels. | | 1200 | 12 | 12.61 MiB | [Download](https://huggingface.co/datasets/CyberHarem/oyashio_azurlane/resolve/main/dataset-1200.zip) | IMG+TXT | dataset with the shorter side not exceeding 1200 pixels. | | stage3-p480-1200 | 28 | 24.90 MiB | [Download](https://huggingface.co/datasets/CyberHarem/oyashio_azurlane/resolve/main/dataset-stage3-p480-1200.zip) | IMG+TXT | 3-stage cropped dataset with the area not less than 480x480 pixels. | ### Load Raw Dataset with Waifuc We provide raw dataset (including tagged images) for [waifuc](https://deepghs.github.io/waifuc/main/tutorials/installation/index.html) loading. If you need this, just run the following code ```python import os import zipfile from huggingface_hub import hf_hub_download from waifuc.source import LocalSource # download raw archive file zip_file = hf_hub_download( repo_id='CyberHarem/oyashio_azurlane', repo_type='dataset', filename='dataset-raw.zip', ) # extract files to your directory dataset_dir = 'dataset_dir' os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, 'r') as zf: zf.extractall(dataset_dir) # load the dataset with waifuc source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta['filename'], item.meta['tags']) ``` ## List of Clusters List of tag clustering result, maybe some outfits can be mined here. ### Raw Text Version | # | Samples | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | Tags | |----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | 0 | 5 | ![](samples/0/clu0-sample0.png) | ![](samples/0/clu0-sample1.png) | ![](samples/0/clu0-sample2.png) | ![](samples/0/clu0-sample3.png) | ![](samples/0/clu0-sample4.png) | 1girl, bare_shoulders, blush, detached_sleeves, japanese_clothes, long_sleeves, looking_at_viewer, open_mouth, simple_background, solo, white_background, wide_sleeves, :d, black_gloves, black_skirt, pleated_skirt, single_thighhigh, sleeveless, standing, uneven_legwear, full_body, partially_fingerless_gloves, shirt, side-tie_panties, single_kneehigh, black_footwear, bridal_gauntlets, crossed_bangs, green_eyes, index_finger_raised, jewelry, legs_apart, long_hair, machinery, magatama, minigirl, miniskirt, mismatched_legwear, oni_horns, pigeon-toed, sash, side_slit, single_glove, single_hair_bun, small_breasts, torpedo_tubes, turret, white_sleeves, zettai_ryouiki | ### Table Version | # | Samples | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | 1girl | bare_shoulders | blush | detached_sleeves | japanese_clothes | long_sleeves | looking_at_viewer | open_mouth | simple_background | solo | white_background | wide_sleeves | :d | black_gloves | black_skirt | pleated_skirt | single_thighhigh | sleeveless | standing | uneven_legwear | full_body | partially_fingerless_gloves | shirt | side-tie_panties | single_kneehigh | black_footwear | bridal_gauntlets | crossed_bangs | green_eyes | index_finger_raised | jewelry | legs_apart | long_hair | machinery | magatama | minigirl | miniskirt | mismatched_legwear | oni_horns | pigeon-toed | sash | side_slit | single_glove | single_hair_bun | small_breasts | torpedo_tubes | turret | white_sleeves | zettai_ryouiki | |----:|----------:|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------------------------------|:--------|:-----------------|:--------|:-------------------|:-------------------|:---------------|:--------------------|:-------------|:--------------------|:-------|:-------------------|:---------------|:-----|:---------------|:--------------|:----------------|:-------------------|:-------------|:-----------|:-----------------|:------------|:------------------------------|:--------|:-------------------|:------------------|:-----------------|:-------------------|:----------------|:-------------|:----------------------|:----------|:-------------|:------------|:------------|:-----------|:-----------|:------------|:---------------------|:------------|:--------------|:-------|:------------|:---------------|:------------------|:----------------|:----------------|:---------|:----------------|:-----------------| | 0 | 5 | ![](samples/0/clu0-sample0.png) | ![](samples/0/clu0-sample1.png) | ![](samples/0/clu0-sample2.png) | ![](samples/0/clu0-sample3.png) | ![](samples/0/clu0-sample4.png) | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X |
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集名称

Dataset of oyashio/親潮/亲潮 (Azur Lane)

数据集描述

该数据集包含12张图片及其标签,主要描述角色oyashio/親潮/亲潮(碧蓝航线)。

核心标签

  • hair_ornament
  • hair_bun
  • x_hair_ornament
  • braid
  • bangs
  • fang
  • hair_between_eyes
  • horns
  • double_bun
  • blonde_hair
  • blue_eyes
  • pointy_ears
  • sidelocks
  • breasts
  • brown_hair

数据集包列表

名称 图片数量 大小 下载链接 类型 描述
raw 12 14.16 MiB Download Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。
800 12 8.40 MiB Download IMG+TXT 短边不超过800像素的数据集。
stage3-p480-800 28 17.77 MiB Download IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。
1200 12 12.61 MiB Download IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 28 24.90 MiB Download IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

标签聚类结果

原始文本版本

# Samples Img-1 Img-2 Img-3 Img-4 Img-5 标签
0 5 1girl, bare_shoulders, blush, detached_sleeves, japanese_clothes, long_sleeves, looking_at_viewer, open_mouth, simple_background, solo, white_background, wide_sleeves, :d, black_gloves, black_skirt, pleated_skirt, single_thighhigh, sleeveless, standing, uneven_legwear, full_body, partially_fingerless_gloves, shirt, side-tie_panties, single_kneehigh, black_footwear, bridal_gauntlets, crossed_bangs, green_eyes, index_finger_raised, jewelry, legs_apart, long_hair, machinery, magatama, minigirl, miniskirt, mismatched_legwear, oni_horns, pigeon-toed, sash, side_slit, single_glove, single_hair_bun, small_breasts, torpedo_tubes, turret, white_sleeves, zettai_ryouiki

表格版本

# Samples Img-1 Img-2 Img-3 Img-4 Img-5 1girl bare_shoulders blush detached_sleeves japanese_clothes long_sleeves looking_at_viewer open_mouth simple_background solo white_background wide_sleeves :d black_gloves black_skirt pleated_skirt single_thighhigh sleeveless standing uneven_legwear full_body partially_fingerless_gloves shirt side-tie_panties single_kneehigh black_footwear bridal_gauntlets crossed_bangs green_eyes index_finger_raised jewelry legs_apart long_hair machinery magatama minigirl miniskirt mismatched_legwear oni_horns pigeon-toed sash side_slit single_glove single_hair_bun small_breasts torpedo_tubes turret white_sleeves zettai_ryouiki
0 5 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
搜集汇总
数据集介绍
main_image_url
构建方式
在动漫角色图像数据集的构建领域,本数据集聚焦于《碧蓝航线》中的角色“亲潮”(Oyashio)。其构建过程依托自动化爬虫系统,从Danbooru、Pixiv、Zerochan等多个知名动漫艺术社区系统性地采集原始图像。采集后的图像经过预处理,包括核心标签的修剪与多版本规格的生成,例如将图像短边统一至特定像素阈值,或进行多阶段裁剪以确保最小区域面积,从而形成结构化的图像-文本配对数据。整个流程体现了数据采集的自动化与标准化特征。
特点
该数据集以角色为中心,收录了12幅高质量图像,每幅均附有经过修剪的详细描述性标签,涵盖了发型、服饰、瞳色等视觉属性。数据集提供了多种预处理版本,包括不同分辨率规格及多阶段裁剪变体,以适应多样化的模型训练需求。此外,通过标签聚类分析,数据集揭示了角色在不同视觉呈现中的共性特征,为风格化研究与特征挖掘提供了结构化参考。其小规模、高精度的特性使其成为角色特异性生成任务的理想实验样本。
使用方法
用户可通过Hugging Face Hub直接下载不同规格的数据包,如原始数据或预处理后的图像-文本对。对于需要完整元数据的应用,可利用提供的Waifuc工具加载原始压缩包,实现本地解压与结构化读取。数据集适用于文本到图像生成模型的训练或微调,尤其适合角色一致性生成、标签条件控制等任务。研究人员可根据不同分辨率版本选择数据,以平衡训练效率与输出质量,或借助聚类结果进行视觉特征分析。
背景与挑战
背景概述
在数字艺术与生成式人工智能蓬勃发展的时代,动漫风格图像生成已成为计算机视觉与多媒体领域的重要研究方向。CyberHarem/oyashio_azurlane数据集由DeepGHS团队构建,专注于收录手机游戏《碧蓝航线》中角色“亲潮”的二次创作图像。该数据集旨在为文本到图像生成模型提供高质量、精细标注的训练样本,其核心研究问题在于如何通过精准的语义标签,驱动模型学习并复现特定动漫角色的复杂视觉特征与艺术风格。此类数据集的涌现,显著推动了角色一致性生成、风格化可控合成等细分领域的技术进步。
当前挑战
该数据集致力于解决动漫角色图像生成中高保真度与强可控性的核心挑战,要求模型能够依据一组具体的属性标签精确合成符合角色设定的图像。在构建过程中,面临多重困难:数据来源分散于多个社区平台,需通过自动化爬虫系统进行收集与整合,此过程涉及版权合规与数据去重问题;原始图像在构图、画风与分辨率上存在显著差异,需进行尺度归一化与多阶段裁剪等预处理以保障数据质量;此外,标签体系的构建与修剪亦需平衡语义粒度与模型可学习性,确保标注既能详尽描述视觉细节,又不过于冗杂干扰训练效率。
常用场景
经典使用场景
在动漫风格图像生成领域,该数据集作为典型的角色特化资源,常被用于训练文本到图像的生成模型。通过提供高精度标注的角色图像与标签对,它支持模型学习特定动漫角色的视觉特征与语义描述之间的映射关系,尤其在生成具有复杂服饰、发型和配饰细节的二次元人物形象方面展现出实用价值。
实际应用
在实际应用中,该数据集可用于动漫内容创作、游戏角色设计及个性化虚拟形象生成。例如,在二次元游戏开发中,借助数据集训练的模型能够快速生成符合设定风格的角色立绘或宣传素材,有效降低美术资源生产成本,同时为同人创作和数字艺术提供灵感和技术支撑。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在动漫风格迁移、角色属性编辑及标签增强生成等领域。例如,基于类似数据构建的模型如Waifu Diffusion等,已在社区中广泛用于定制化角色生成;同时,其标注体系也启发了对动漫图像语义分割、标签聚类方法的深入研究,促进了动漫图像理解技术的进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作