five

CyberHarem/allen_m_sumner_azurlane

收藏
Hugging Face2024-01-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/allen_m_sumner_azurlane
下载链接
链接失效反馈
官方服务:
资源简介:
这是allen_m_sumner/アレン・M・サムナー/艾伦·萨姆纳 (Azur Lane)的数据集,包含41张图片及其标签。该角色的核心标签包括`breasts, long_hair, red_eyes, black_hair, bangs, hair_between_eyes, twintails, hair_ornament, medium_breasts, very_long_hair, bow, large_breasts, animal_ears, blue_hair`,这些标签在数据集中已被修剪。图片来源于多个网站(如danbooru、pixiv、zerochan等),并由DeepGHS团队的自动爬取系统收集。
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集信息

  • 名称: allen_m_sumner/アレン・M・サムナー/艾伦·萨姆纳 (Azur Lane)
  • 许可证: MIT
  • 任务类别: text-to-image
  • 标签: art, not-for-all-audiences
  • 大小类别: n<1K

数据集内容

  • 图像数量: 41张
  • 核心标签: breasts, long_hair, red_eyes, black_hair, bangs, hair_between_eyes, twintails, hair_ornament, medium_breasts, very_long_hair, bow, large_breasts, animal_ears, blue_hair

数据包列表

名称 图像数量 大小 类型 描述
raw 41 67.13 MiB Waifuc-Raw 原始数据,包含元信息(最小边对齐到1400像素,如果更大)。
800 41 35.12 MiB IMG+TXT 短边不超过800像素的数据集。
stage3-p480-800 104 76.03 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。
1200 41 57.56 MiB IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 104 113.14 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

标签聚类结果

原始文本版本

# 样本数量 图像示例 标签
0 13 1girl, bare_shoulders, double_bun, off_shoulder, official_alternate_costume, playboy_bunny, rabbit_ears, solo, black_jacket, black_leotard, long_sleeves, looking_at_viewer, open_jacket, fake_animal_ears, smile, hair_bow, underboob_cutout, braided_bun, brown_pantyhose, sitting, ass, tongue_out, bodystocking, closed_mouth, simple_background, sleeves_past_wrists, black_footwear, blush, shoes, white_background
1 18 looking_at_viewer, underboob_cutout, 1girl, solo, bare_shoulders, two-tone_leotard, off_shoulder, open_coat, black_leotard, open_mouth, skindentation, black_coat, blush, groin, long_sleeves, thigh_strap, badge, cowboy_shot, frilled_leotard, standing, sidelocks, :d, armpits, ass_visible_through_thighs, white_leotard

表格版本

# 样本数量 图像示例 1girl bare_shoulders double_bun off_shoulder official_alternate_costume playboy_bunny rabbit_ears solo black_jacket black_leotard long_sleeves looking_at_viewer open_jacket fake_animal_ears smile hair_bow underboob_cutout braided_bun brown_pantyhose sitting ass tongue_out bodystocking closed_mouth simple_background sleeves_past_wrists black_footwear blush shoes white_background two-tone_leotard open_coat open_mouth skindentation black_coat groin thigh_strap badge cowboy_shot frilled_leotard standing sidelocks :d armpits ass_visible_through_thighs white_leotard
0 13 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
1 18 X X X X X X X X X X X X X X X X X X X X X X X X X
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集聚焦于《碧蓝航线》角色艾伦·萨姆纳,共收录41幅图像及其对应标签。数据采集源自Danbooru、Pixiv、Zerochan等多个平台,依托DeepGHS团队开发的自动化爬取系统完成。原始图像经预处理后,提供了多种规格版本:raw版本保留元数据且最小边对齐至1400像素;800与1200版本分别将短边限制在不超过800与1200像素;stage3-p480-800与stage3-p480-1200则采用三阶段裁剪策略,确保裁剪区域不小于480×480像素,从而生成更多样化的图像块。核心标签如乳房、长发、红瞳等已被精简,便于下游任务使用。
特点
数据集以角色为中心,兼具规模精简与版本多样性的特点。41幅原始图像通过不同分辨率与裁剪策略衍生出104个数据样本,满足了从粗粒度到细粒度的训练需求。标签系统经过精心修剪,仅保留角色最具辨识度的核心视觉特征,如蓝发、双马尾、动物耳等,去除了冗余信息。此外,数据集还提供了基于标签聚类的分析结果,将图像按照服饰与姿态(如兔女郎装、露肩装)分为不同簇,为风格迁移或角色变装研究提供了结构化视角。整体上,该数据集在保持高质量的同时,兼顾了灵活性与可扩展性。
使用方法
数据集支持通过Waifuc库直接加载raw版本,用户可借助HuggingFace Hub下载压缩包并解压至本地目录,随后使用LocalSource接口遍历图像及其元数据中的文件名与标签信息。对于非raw版本,数据集以IMG+TXT格式提供,即图像与对应文本标签配对,可直接用于文本到图像生成模型的训练或微调。聚类结果以表格形式呈现,便于研究者快速定位特定外观组合的样本子集。用户可根据任务需求选择合适的分辨率或裁剪版本,例如使用stage3版本以增加训练数据的多样性。
背景与挑战
背景概述
在动漫角色图像生成与多模态学习领域,高质量、细粒度标注的数据集是驱动模型性能提升的关键基石。CyberHarem团队于近年构建的allen_m_sumner_azurlane数据集,聚焦于《碧蓝航线》中角色“艾伦·萨姆纳”的视觉表征,由DeepGHS组织主导开发,旨在为文本到图像生成任务提供精准的标签-图像配对资源。该数据集包含41张精心采集的高清图像,并附带从Danbooru、Pixiv等多源平台自动爬取的核心标签,如发型、瞳色、服饰等细粒度属性。其影响力在于填补了特定二次元角色标准化数据集的空白,为风格迁移、角色定制化生成及多标签分类研究提供了可复用的基准,推动了动漫领域细粒度视觉理解的发展。
当前挑战
该数据集面临的核心挑战在于领域问题的复杂性与构建过程的局限性。首先,在图像生成任务中,仅41张样本的规模难以覆盖角色多样化的姿态与场景,导致模型易出现过拟合或泛化不足,尤其在处理非标准服饰(如“playboy_bunny”变体)时,标签稀疏性可能引发语义歧义。其次,构建过程中,自动爬取系统虽高效,但面临跨平台图像质量参差、元数据不一致及版权合规风险;同时,标签裁剪策略虽简化了核心属性,却可能丢失上下文关联信息(如背景与交互动作),影响模型对角色完整语义的建模。此外,多阶段裁剪(如stage3-p480-800)虽提升了局部特征分辨率,但引入的图像碎片化问题增加了训练时的对齐难度。
常用场景
经典使用场景
在动漫风格图像生成与角色定制领域,该数据集常用于训练和微调文本到图像的扩散模型。研究者利用其中包含的41张高分辨率艾伦·萨姆纳角色图像及其精细标注的标签(如发型、瞳色、服饰细节),构建条件生成模型,使模型能够依据文本描述准确还原该角色的视觉特征。数据集经过多尺度裁剪与标签聚类,便于研究者探索不同分辨率与构图下的生成效果,是二次元角色特定概念学习与风格迁移的经典基准。
实际应用
在实际应用中,该数据集赋能了游戏与动漫产业的自动化内容生产。开发者可利用其训练的模型快速生成艾伦·萨姆纳在游戏《碧蓝航线》中的宣传图、同人插画或衍生商品设计图,大幅降低人工绘画成本。此外,数据集支持的标签系统可直接对接电商平台的虚拟形象定制服务,用户通过描述即可生成个性化角色外观,已在虚拟主播形象生成与粉丝创作工具中展现显著价值。
衍生相关工作
该数据集衍生了一系列经典工作,包括基于LoRA(Low-Rank Adaptation)的角色微调方法,研究者利用其标签聚类结果设计条件嵌入层,实现角色身份与背景风格的高效分离。另一项代表性工作是标签自监督学习框架,通过聚类标签间的共现关系自动发现角色‘兔女郎装’与‘日常装’等概念子空间,被后续的DreamBooth和Textual Inversion方法广泛引用。这些工作共同推进了动漫领域个性化生成模型的鲁棒性与可解释性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作