CyberHarem/shirasagi_chisato_bangdream

Name: CyberHarem/shirasagi_chisato_bangdream
Creator: CyberHarem
Published: 2024-01-15 20:17:44
License: 暂无描述

Hugging Face2024-01-15 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/CyberHarem/shirasagi_chisato_bangdream

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个名为shirasagi_chisato (BanG Dream!)的数据集，包含405张图片及其标签。图片从多个网站（如danbooru、pixiv、zerochan等）爬取，爬取系统由DeepGHS团队开发。数据集的核心标签包括`blonde_hair, long_hair, bangs, purple_eyes, half_updo, ribbon`。数据集提供了多种下载选项，包括原始数据、不同分辨率的图片以及经过裁剪的图片。此外，还提供了如何使用waifuc加载原始数据集的代码示例。

提供机构：

CyberHarem

原始信息汇总

数据集概述

数据集信息

名称: shirasagi_chisato (BanG Dream!)
许可证: MIT
任务类别: 文本到图像
标签: 艺术, 非所有观众适用
大小类别: n<1K

数据集内容

图像数量: 405张
核心标签: blonde_hair, long_hair, bangs, purple_eyes, half_updo, ribbon
来源: 从多个网站爬取，如danbooru, pixiv, zerochan等

数据包列表

名称	图像数量	大小	类型	描述
raw	405	480.42 MiB	Waifuc-Raw	原始数据，包含元信息（最小边对齐到1400像素，如果更大）
800	405	302.02 MiB	IMG+TXT	短边不超过800像素的图像数据集
stage3-p480-800	939	612.88 MiB	IMG+TXT	3阶段裁剪数据集，区域不小于480x480像素
1200	405	434.28 MiB	IMG+TXT	短边不超过1200像素的图像数据集
stage3-p480-1200	939	832.06 MiB	IMG+TXT	3阶段裁剪数据集，区域不小于480x480像素

标签聚类结果

示例: 包含多个标签聚类结果，每个聚类包含不同数量的样本和相关标签。

搜集汇总

数据集介绍

构建方式

该数据集聚焦于《BanG Dream!》中的角色白鷺千聖，共计收录405张图像及其对应标签。数据采集源自多个知名插画平台，如Danbooru、Pixiv及Zerochan等，依托DeepGHS团队开发的自动化爬取系统完成。在构建过程中，对核心角色特征标签（如金发、长发、刘海、紫瞳、半扎发及发饰）进行了精心筛选与精简。数据集以多种分辨率规格提供，包括原始高清版本（边缘对齐至1400像素）、短边不超过800像素或1200像素的压缩版本，以及经过三阶段裁剪处理、确保区域不小于480×480像素的增强版本，以满足不同训练需求。

特点

该数据集最显著的特点在于其丰富的标签聚类结果，通过自动聚类技术将图像按视觉特征与语义标签划分为多个群组，揭示了角色在不同着装、场景与互动下的多样化呈现。例如，聚类结果涵盖了校园制服、演出服装、和服、泳装乃至特定情境下的双人互动，每个聚类均附带样本图像与详细标签列表，便于用户深入挖掘角色特征。此外，数据集提供了多种下载格式，包括原始元数据包（Waifuc-Raw）以及可直接用于训练的IMG+TXT格式，极大提升了使用的灵活性。

使用方法

用户可通过Hugging Face Hub便捷地获取该数据集。对于希望使用原始元数据的用户，推荐借助Waifuc工具进行加载：首先通过hf_hub_download函数下载对应的ZIP压缩包，解压至本地目录后，利用LocalSource接口即可遍历图像及其标签信息，实现自定义的数据处理流水线。若需直接用于模型训练，则可选择下载800、1200或stage3系列的分辨率版本，这些版本已包含对齐的图像与标签文件，可直接接入常见的文本到图像生成框架，简化了数据预处理流程。

背景与挑战

背景概述

该数据集由CyberHarem团队于近期构建，专注于收录《BanG Dream!》角色白鹭千圣的视觉素材，旨在为文本到图像生成任务提供精细化的动漫角色数据支持。研究团队通过自动化爬取系统从Danbooru、Pixiv、Zerochan等多源平台采集405张图像，并辅以核心标签（如金发、长发、刘海、紫瞳、半盘发、丝带）进行筛选与标注。该数据集的核心研究问题在于如何通过高质量、多视角的动漫角色图像集合，提升生成模型对特定角色外貌与风格特征的还原能力，尤其关注服饰、发型、表情等细节的泛化表现。作为二次元领域细粒度角色数据集，其影响力体现在为LoRA微调、风格迁移等下游任务提供了标准化训练资源，填补了特定ACG角色数据集的空白。

当前挑战

当前数据集面临多重挑战：首先，在领域问题层面，动漫角色生成需解决类内多样性不足与背景干扰问题——405张图像中多包含白色或简单背景，且部分图像存在多人物共现（如2girls标签），导致模型易混淆主体与噪声特征；其次，构建过程中，爬取自不同平台的图像在分辨率（从480×480到1400像素）、画风（如插画与官方海报混用）及标签一致性（如部分图像含裸露或性暗示内容）上存在显著差异，需通过三级裁剪与标签聚类（如14个聚类组）进行筛选，但聚类结果中仍混有非目标标签（如hetero、penis），增加了数据清洗的复杂性；此外，数据规模较小（n<1K）限制了生成模型对角色多姿态、复杂场景的泛化能力，易导致过拟合于高频出现的服饰（如校服、黄色连衣裙）与构图模式。

常用场景

经典使用场景

该数据集以《BanG Dream!》中角色白鷺千聖为核心，收录了405张经过精细标注的二次元图像，覆盖了校服、演出服、泳装及和服等多种服饰风格，并提供了raw、800、1200及三级裁剪等多种分辨率版本。其最经典的用途在于支撑文本到图像（text-to-image）生成模型的训练与微调，研究者可借助配套的waifuc工具高效加载原始数据，利用标签聚类结果（如校园、舞台、日常等场景）进行条件生成或风格迁移实验，从而提升模型对特定角色外貌特征（如金发、紫瞳、半扎发髻）的忠实还原能力。

实际应用

在实际应用中，该数据集被广泛用于开发面向二次元创作的辅助工具，例如自动生成角色立绘、个性化头像定制或游戏内换装预览系统。开发者可基于其提供的多分辨率包（如480×480裁剪版）快速训练轻量级生成模型，用于移动端或Web端的实时图像合成。此外，标签聚类结果还可服务于虚拟偶像的服饰设计推荐，通过挖掘常见服饰组合（如水手服与蝴蝶结）来启发创意，降低人工原画设计的迭代成本。

衍生相关工作

该数据集衍生了一系列经典工作，包括基于角色标签聚类的语义分割模型训练、面向动漫图像的风格迁移网络优化，以及利用三级裁剪策略改进图像生成质量的研究。其中，部分工作进一步扩展了数据集的覆盖范围，将其与同一IP下其他角色的数据联合训练，构建了多角色统一生成框架。此外，围绕该数据集的标签体系，研究者还提出了自动标签修正与长尾分布平衡算法，显著提升了模型在罕见服饰场景下的生成稳定性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集