five

CyberHarem/shirasagi_chisato_bangdream

收藏
Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/shirasagi_chisato_bangdream
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为shirasagi_chisato (BanG Dream!)的数据集,包含405张图片及其标签。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队开发。数据集的核心标签包括`blonde_hair, long_hair, bangs, purple_eyes, half_updo, ribbon`。数据集提供了多种下载选项,包括原始数据、不同分辨率的图片以及经过裁剪的图片。此外,还提供了如何使用waifuc加载原始数据集的代码示例。
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集信息

  • 名称: shirasagi_chisato (BanG Dream!)
  • 许可证: MIT
  • 任务类别: 文本到图像
  • 标签: 艺术, 非所有观众适用
  • 大小类别: n<1K

数据集内容

  • 图像数量: 405张
  • 核心标签: blonde_hair, long_hair, bangs, purple_eyes, half_updo, ribbon
  • 来源: 从多个网站爬取,如danbooru, pixiv, zerochan等

数据包列表

名称 图像数量 大小 类型 描述
raw 405 480.42 MiB Waifuc-Raw 原始数据,包含元信息(最小边对齐到1400像素,如果更大)
800 405 302.02 MiB IMG+TXT 短边不超过800像素的图像数据集
stage3-p480-800 939 612.88 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素
1200 405 434.28 MiB IMG+TXT 短边不超过1200像素的图像数据集
stage3-p480-1200 939 832.06 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素

标签聚类结果

  • 示例: 包含多个标签聚类结果,每个聚类包含不同数量的样本和相关标签。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集聚焦于《BanG Dream!》中的角色白鷺千聖,共计收录405张图像及其对应标签。数据采集源自多个知名插画平台,如Danbooru、Pixiv及Zerochan等,依托DeepGHS团队开发的自动化爬取系统完成。在构建过程中,对核心角色特征标签(如金发、长发、刘海、紫瞳、半扎发及发饰)进行了精心筛选与精简。数据集以多种分辨率规格提供,包括原始高清版本(边缘对齐至1400像素)、短边不超过800像素或1200像素的压缩版本,以及经过三阶段裁剪处理、确保区域不小于480×480像素的增强版本,以满足不同训练需求。
特点
该数据集最显著的特点在于其丰富的标签聚类结果,通过自动聚类技术将图像按视觉特征与语义标签划分为多个群组,揭示了角色在不同着装、场景与互动下的多样化呈现。例如,聚类结果涵盖了校园制服、演出服装、和服、泳装乃至特定情境下的双人互动,每个聚类均附带样本图像与详细标签列表,便于用户深入挖掘角色特征。此外,数据集提供了多种下载格式,包括原始元数据包(Waifuc-Raw)以及可直接用于训练的IMG+TXT格式,极大提升了使用的灵活性。
使用方法
用户可通过Hugging Face Hub便捷地获取该数据集。对于希望使用原始元数据的用户,推荐借助Waifuc工具进行加载:首先通过hf_hub_download函数下载对应的ZIP压缩包,解压至本地目录后,利用LocalSource接口即可遍历图像及其标签信息,实现自定义的数据处理流水线。若需直接用于模型训练,则可选择下载800、1200或stage3系列的分辨率版本,这些版本已包含对齐的图像与标签文件,可直接接入常见的文本到图像生成框架,简化了数据预处理流程。
背景与挑战
背景概述
该数据集由CyberHarem团队于近期构建,专注于收录《BanG Dream!》角色白鹭千圣的视觉素材,旨在为文本到图像生成任务提供精细化的动漫角色数据支持。研究团队通过自动化爬取系统从Danbooru、Pixiv、Zerochan等多源平台采集405张图像,并辅以核心标签(如金发、长发、刘海、紫瞳、半盘发、丝带)进行筛选与标注。该数据集的核心研究问题在于如何通过高质量、多视角的动漫角色图像集合,提升生成模型对特定角色外貌与风格特征的还原能力,尤其关注服饰、发型、表情等细节的泛化表现。作为二次元领域细粒度角色数据集,其影响力体现在为LoRA微调、风格迁移等下游任务提供了标准化训练资源,填补了特定ACG角色数据集的空白。
当前挑战
当前数据集面临多重挑战:首先,在领域问题层面,动漫角色生成需解决类内多样性不足与背景干扰问题——405张图像中多包含白色或简单背景,且部分图像存在多人物共现(如2girls标签),导致模型易混淆主体与噪声特征;其次,构建过程中,爬取自不同平台的图像在分辨率(从480×480到1400像素)、画风(如插画与官方海报混用)及标签一致性(如部分图像含裸露或性暗示内容)上存在显著差异,需通过三级裁剪与标签聚类(如14个聚类组)进行筛选,但聚类结果中仍混有非目标标签(如hetero、penis),增加了数据清洗的复杂性;此外,数据规模较小(n<1K)限制了生成模型对角色多姿态、复杂场景的泛化能力,易导致过拟合于高频出现的服饰(如校服、黄色连衣裙)与构图模式。
常用场景
经典使用场景
该数据集以《BanG Dream!》中角色白鷺千聖为核心,收录了405张经过精细标注的二次元图像,覆盖了校服、演出服、泳装及和服等多种服饰风格,并提供了raw、800、1200及三级裁剪等多种分辨率版本。其最经典的用途在于支撑文本到图像(text-to-image)生成模型的训练与微调,研究者可借助配套的waifuc工具高效加载原始数据,利用标签聚类结果(如校园、舞台、日常等场景)进行条件生成或风格迁移实验,从而提升模型对特定角色外貌特征(如金发、紫瞳、半扎发髻)的忠实还原能力。
实际应用
在实际应用中,该数据集被广泛用于开发面向二次元创作的辅助工具,例如自动生成角色立绘、个性化头像定制或游戏内换装预览系统。开发者可基于其提供的多分辨率包(如480×480裁剪版)快速训练轻量级生成模型,用于移动端或Web端的实时图像合成。此外,标签聚类结果还可服务于虚拟偶像的服饰设计推荐,通过挖掘常见服饰组合(如水手服与蝴蝶结)来启发创意,降低人工原画设计的迭代成本。
衍生相关工作
该数据集衍生了一系列经典工作,包括基于角色标签聚类的语义分割模型训练、面向动漫图像的风格迁移网络优化,以及利用三级裁剪策略改进图像生成质量的研究。其中,部分工作进一步扩展了数据集的覆盖范围,将其与同一IP下其他角色的数据联合训练,构建了多角色统一生成框架。此外,围绕该数据集的标签体系,研究者还提出了自动标签修正与长尾分布平衡算法,显著提升了模型在罕见服饰场景下的生成稳定性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作