five

CyberHarem/kuroshio_azurlane

收藏
Hugging Face2024-01-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/kuroshio_azurlane
下载链接
链接失效反馈
官方服务:
资源简介:
这是名为kuroshio/黒潮/黑潮 (Azur Lane)的数据集,包含10张图片及其标签。图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬取系统由DeepGHS团队开发。数据集的核心标签包括braid, horns, red_eyes, hair_flower, hair_ornament, long_hair, twin_braids, bangs, pointy_ears, black_hair, bow, red_bow, hair_bow, sidelocks, red_ribbon。此外,README还提供了不同版本的下载链接,包括原始数据、不同分辨率的图片以及经过裁剪的图片。最后,README还提供了如何使用waifuc工具加载原始数据集的代码示例。

这是名为kuroshio/黒潮/黑潮 (Azur Lane)的数据集,包含10张图片及其标签。图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬取系统由DeepGHS团队开发。数据集的核心标签包括braid, horns, red_eyes, hair_flower, hair_ornament, long_hair, twin_braids, bangs, pointy_ears, black_hair, bow, red_bow, hair_bow, sidelocks, red_ribbon。此外,README还提供了不同版本的下载链接,包括原始数据、不同分辨率的图片以及经过裁剪的图片。最后,README还提供了如何使用waifuc工具加载原始数据集的代码示例。
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集名称

Dataset of kuroshio/黒潮/黑潮 (Azur Lane)

数据集描述

该数据集包含10张图片及其标签,主题为Azur Lane中的角色kuroshio/黒潮/黑潮。

核心标签

  • braid
  • horns
  • red_eyes
  • hair_flower
  • hair_ornament
  • long_hair
  • twin_braids
  • bangs
  • pointy_ears
  • black_hair
  • bow
  • red_bow
  • hair_bow
  • sidelocks
  • red_ribbon

数据集包列表

名称 图片数量 大小 类型 描述
raw 10 10.75 MiB Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。
800 10 6.29 MiB IMG+TXT 短边不超过800像素的数据集。
stage3-p480-800 21 11.74 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。
1200 10 9.34 MiB IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 21 16.61 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

标签聚类结果

原始文本版本

# 样本数量 图片1 图片2 图片3 图片4 图片5 标签
0 10 1girl, solo, looking_at_viewer, black_scarf, pleated_skirt, red_thighhighs, bare_shoulders, black_skirt, obi, white_background, bridal_gauntlets, elbow_gloves, panties, simple_background, garter_straps, weapon, blush, closed_mouth, floral_print, full_body, kimono, pink_flower, shoes, white_footwear

表格版本

# 样本数量 图片1 图片2 图片3 图片4 图片5 1girl solo looking_at_viewer black_scarf pleated_skirt red_thighhighs bare_shoulders black_skirt obi white_background bridal_gauntlets elbow_gloves panties simple_background garter_straps weapon blush closed_mouth floral_print full_body kimono pink_flower shoes white_footwear
0 10 X X X X X X X X X X X X X X X X X X X X X X X X
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集聚焦于《碧蓝航线》角色“黑潮”(Kuroshio),旨在为文本到图像生成任务提供高质量训练素材。数据集的构建依托于DeepGHS团队开发的自动化爬取系统,从Danbooru、Pixiv、Zerochan等多个知名图源站点收集图像,共计10张图片及其对应的标签信息。原始数据经过精心筛选与裁剪,核心标签如辫子、角、红瞳、花饰、长发等被保留并精简,以确保特征聚焦。数据集以多种格式打包发布,包括原始数据包(含元信息)、限定短边不超过800或1200像素的标准化版本,以及经过三级裁剪、面积不低于480x480像素的增强版本,满足不同训练需求。
特点
该数据集具有鲜明的领域特性与实用价值。其核心特征在于围绕单一动漫角色构建,标签体系高度专业化,涵盖外貌细节(如发型、瞳色、装饰)和服饰元素(如围巾、百褶裙、红色过膝袜),便于模型学习特定角色的视觉一致性。数据集规模虽小(n<1K),但通过多版本打包(原始、缩放、裁剪)提供了灵活性,其中三级裁剪版本通过分割生成21个样本,有效扩充了数据量。此外,数据集还提供标签聚类结果,以表格形式展示图像与标签的对应关系,便于用户挖掘角色的不同装扮模式,为风格迁移或角色定制任务奠定基础。
使用方法
该数据集的使用方式灵活多样,主要面向文本到图像生成模型的训练与微调。用户可直接通过Hugging Face Hub下载压缩包,包括原始数据(dataset-raw.zip)及其缩放或裁剪版本。对于原始数据,推荐使用Waifuc库进行加载:通过huggingface_hub下载文件后,解压至本地目录,再利用LocalSource读取图像及元信息中的标签。缩放版本(如800或1200)则直接解压后即可作为图像-文本对使用,适用于常见训练框架。此外,用户可参考提供的标签聚类结果,按需选择特定装扮的子集进行针对性训练,以优化模型对角色细节的生成能力。
背景与挑战
背景概述
在文本到图像生成领域,高质量、标注精细的动漫角色数据集对于训练可控生成模型至关重要。CyberHarem团队于近期构建了kuroshio_azurlane数据集,聚焦于游戏《碧蓝航线》中的角色黑潮。该数据集由DeepGHS团队主导开发,包含10张经过精心筛选和标注的图像,核心标签涵盖辫子、角、红眼、长发等角色标志性特征。通过从Danbooru、Pixiv等多源平台自动爬取并统一标注,该数据集为动漫角色定制化生成研究提供了标准化基准,推动了二次元风格图像生成模型在角色一致性保持方面的进展。
当前挑战
该数据集面临的核心挑战首先在于动漫角色图像生成中的细粒度特征保持问题,如何使模型在生成过程中准确复现黑潮的辫子、角、蝴蝶结等组合性视觉元素,避免特征混淆或丢失,是领域内亟待突破的难点。其次,数据集构建过程中遭遇了样本稀缺与标注质量平衡的困境,仅10张原始图像难以覆盖角色在不同姿态、场景下的多样性,而自动爬取系统虽高效,但源自多源的图像在分辨率、画风上存在差异,需通过三级裁剪与尺寸标准化流程来统一数据分布,这对自动化流水线的鲁棒性提出了较高要求。
常用场景
经典使用场景
在文本到图像生成领域,CyberHarem/kuroshio_azurlane数据集为特定动漫角色(如《碧蓝航线》中的黑潮)的精细化图像合成提供了高质量的训练素材。该数据集包含10张经过严格筛选与标注的图片,并提供了多种分辨率版本(如800px、1200px)及三级裁剪方案,便于研究者根据模型需求灵活选择。其核心标签体系(如braid、horns、red_eyes等)精准刻画了角色视觉特征,常被用于训练Stable Diffusion等扩散模型,以生成风格统一、细节还原度高的角色图像,尤其适用于少样本学习场景下的个性化生成任务。
解决学术问题
该数据集解决了动漫角色图像生成中因数据稀缺导致的模型过拟合与泛化能力不足问题。通过提供多尺度、多裁剪策略的数据版本,它支持研究者探索数据增强对生成质量的影响,并验证标签驱动生成(如tag-to-image)的可行性。此外,其标签聚类结果(如服饰组合分析)为可控图像生成中的属性解耦研究提供了基准,推动了面向特定角色或风格的高保真生成技术发展,在学术上促进了领域自适应与迁移学习在动漫图像生成中的应用。
衍生相关工作
该数据集衍生出多项代表性工作,如基于Waifuc框架的自动化数据爬取与清洗流程,以及针对动漫角色的多阶段裁剪算法(stage3-crop)。研究者还以此为基础,开发了角色身份保持的图像生成模型(如DreamBooth微调变体),并探索了标签噪声对生成质量的影响。此外,聚类结果中的服饰组合分析启发了面向角色换装的可控生成研究,推动了动漫图像领域从简单生成到精细语义控制的演进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作