CyberHarem/shirasagi_chisato_bangdream
收藏Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/shirasagi_chisato_bangdream
下载链接
链接失效反馈官方服务:
资源简介:
这是一个名为shirasagi_chisato (BanG Dream!)的数据集,包含405张图片及其标签。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队开发。数据集的核心标签包括`blonde_hair, long_hair, bangs, purple_eyes, half_updo, ribbon`。数据集提供了多种下载选项,包括原始数据、不同分辨率的图片以及经过裁剪的图片。此外,还提供了如何使用waifuc加载原始数据集的代码示例。
提供机构:
CyberHarem
原始信息汇总
数据集概述
数据集信息
- 名称: shirasagi_chisato (BanG Dream!)
- 许可证: MIT
- 任务类别: 文本到图像
- 标签: 艺术, 非所有观众适用
- 大小类别: n<1K
数据集内容
- 图像数量: 405张
- 核心标签:
blonde_hair, long_hair, bangs, purple_eyes, half_updo, ribbon - 来源: 从多个网站爬取,如danbooru, pixiv, zerochan等
数据包列表
| 名称 | 图像数量 | 大小 | 类型 | 描述 |
|---|---|---|---|---|
| raw | 405 | 480.42 MiB | Waifuc-Raw | 原始数据,包含元信息(最小边对齐到1400像素,如果更大) |
| 800 | 405 | 302.02 MiB | IMG+TXT | 短边不超过800像素的图像数据集 |
| stage3-p480-800 | 939 | 612.88 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 |
| 1200 | 405 | 434.28 MiB | IMG+TXT | 短边不超过1200像素的图像数据集 |
| stage3-p480-1200 | 939 | 832.06 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 |
标签聚类结果
- 示例: 包含多个标签聚类结果,每个聚类包含不同数量的样本和相关标签。
搜集汇总
数据集介绍

构建方式
该数据集聚焦于《BanG Dream!》中的角色白鷺千聖,共计收录405张图像及其对应标签。数据采集源自多个知名插画平台,如Danbooru、Pixiv及Zerochan等,依托DeepGHS团队开发的自动化爬取系统完成。在构建过程中,对核心角色特征标签(如金发、长发、刘海、紫瞳、半扎发及发饰)进行了精心筛选与精简。数据集以多种分辨率规格提供,包括原始高清版本(边缘对齐至1400像素)、短边不超过800像素或1200像素的压缩版本,以及经过三阶段裁剪处理、确保区域不小于480×480像素的增强版本,以满足不同训练需求。
特点
该数据集最显著的特点在于其丰富的标签聚类结果,通过自动聚类技术将图像按视觉特征与语义标签划分为多个群组,揭示了角色在不同着装、场景与互动下的多样化呈现。例如,聚类结果涵盖了校园制服、演出服装、和服、泳装乃至特定情境下的双人互动,每个聚类均附带样本图像与详细标签列表,便于用户深入挖掘角色特征。此外,数据集提供了多种下载格式,包括原始元数据包(Waifuc-Raw)以及可直接用于训练的IMG+TXT格式,极大提升了使用的灵活性。
使用方法
用户可通过Hugging Face Hub便捷地获取该数据集。对于希望使用原始元数据的用户,推荐借助Waifuc工具进行加载:首先通过hf_hub_download函数下载对应的ZIP压缩包,解压至本地目录后,利用LocalSource接口即可遍历图像及其标签信息,实现自定义的数据处理流水线。若需直接用于模型训练,则可选择下载800、1200或stage3系列的分辨率版本,这些版本已包含对齐的图像与标签文件,可直接接入常见的文本到图像生成框架,简化了数据预处理流程。
背景与挑战
背景概述
该数据集由CyberHarem团队于近期构建,专注于收录《BanG Dream!》角色白鹭千圣的视觉素材,旨在为文本到图像生成任务提供精细化的动漫角色数据支持。研究团队通过自动化爬取系统从Danbooru、Pixiv、Zerochan等多源平台采集405张图像,并辅以核心标签(如金发、长发、刘海、紫瞳、半盘发、丝带)进行筛选与标注。该数据集的核心研究问题在于如何通过高质量、多视角的动漫角色图像集合,提升生成模型对特定角色外貌与风格特征的还原能力,尤其关注服饰、发型、表情等细节的泛化表现。作为二次元领域细粒度角色数据集,其影响力体现在为LoRA微调、风格迁移等下游任务提供了标准化训练资源,填补了特定ACG角色数据集的空白。
当前挑战
当前数据集面临多重挑战:首先,在领域问题层面,动漫角色生成需解决类内多样性不足与背景干扰问题——405张图像中多包含白色或简单背景,且部分图像存在多人物共现(如2girls标签),导致模型易混淆主体与噪声特征;其次,构建过程中,爬取自不同平台的图像在分辨率(从480×480到1400像素)、画风(如插画与官方海报混用)及标签一致性(如部分图像含裸露或性暗示内容)上存在显著差异,需通过三级裁剪与标签聚类(如14个聚类组)进行筛选,但聚类结果中仍混有非目标标签(如hetero、penis),增加了数据清洗的复杂性;此外,数据规模较小(n<1K)限制了生成模型对角色多姿态、复杂场景的泛化能力,易导致过拟合于高频出现的服饰(如校服、黄色连衣裙)与构图模式。
常用场景
经典使用场景
该数据集以《BanG Dream!》中角色白鷺千聖为核心,收录了405张经过精细标注的二次元图像,覆盖了校服、演出服、泳装及和服等多种服饰风格,并提供了raw、800、1200及三级裁剪等多种分辨率版本。其最经典的用途在于支撑文本到图像(text-to-image)生成模型的训练与微调,研究者可借助配套的waifuc工具高效加载原始数据,利用标签聚类结果(如校园、舞台、日常等场景)进行条件生成或风格迁移实验,从而提升模型对特定角色外貌特征(如金发、紫瞳、半扎发髻)的忠实还原能力。
实际应用
在实际应用中,该数据集被广泛用于开发面向二次元创作的辅助工具,例如自动生成角色立绘、个性化头像定制或游戏内换装预览系统。开发者可基于其提供的多分辨率包(如480×480裁剪版)快速训练轻量级生成模型,用于移动端或Web端的实时图像合成。此外,标签聚类结果还可服务于虚拟偶像的服饰设计推荐,通过挖掘常见服饰组合(如水手服与蝴蝶结)来启发创意,降低人工原画设计的迭代成本。
衍生相关工作
该数据集衍生了一系列经典工作,包括基于角色标签聚类的语义分割模型训练、面向动漫图像的风格迁移网络优化,以及利用三级裁剪策略改进图像生成质量的研究。其中,部分工作进一步扩展了数据集的覆盖范围,将其与同一IP下其他角色的数据联合训练,构建了多角色统一生成框架。此外,围绕该数据集的标签体系,研究者还提出了自动标签修正与长尾分布平衡算法,显著提升了模型在罕见服饰场景下的生成稳定性。
以上内容由遇见数据集搜集并总结生成



