five

CyberHarem/toyama_asuka_bangdream

收藏
Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/toyama_asuka_bangdream
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于BanG Dream!系列中的角色toyama_asuka的数据集,包含12张带有标签的图片。图片从danbooru、pixiv、zerochan等多个网站爬取,由DeepGHS团队自动收集。数据集提供不同尺寸和格式的包,支持使用waifuc工具加载,并附有标签聚类结果列表,便于进一步分析。

这是一个关于BanG Dream!系列中的角色toyama_asuka的数据集,包含12张带有标签的图片。图片从danbooru、pixiv、zerochan等多个网站爬取,由DeepGHS团队自动收集。数据集提供不同尺寸和格式的包,支持使用waifuc工具加载,并附有标签聚类结果列表,便于进一步分析。
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集信息

  • 名称: Dataset of toyama_asuka (BanG Dream!)
  • 许可证: MIT
  • 任务类别: text-to-image
  • 标签: art, not-for-all-audiences
  • 数据量: n<1K

数据集内容

  • 图像数量: 12张
  • 核心标签: brown_hair, purple_eyes, short_hair, bangs, hair_ornament, hairclip
  • 来源: 从多个网站爬取,如danbooru, pixiv, zerochan等

数据包列表

名称 图像数量 大小 类型 描述
raw 12 11.43 MiB Waifuc-Raw 原始数据,包含元信息(最小边对齐到1400像素,如果更大)。
800 12 6.24 MiB IMG+TXT 短边不超过800像素的数据集。
stage3-p480-800 28 13.28 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。
1200 12 10.12 MiB IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 28 18.80 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

标签聚类结果

原始文本版本

# 样本数量 图像1 图像2 图像3 图像4 图像5 标签
0 12 1girl, solo, blush, looking_at_viewer, shirt, holding, closed_mouth, long_sleeves, smile

表格版本

# 样本数量 图像1 图像2 图像3 图像4 图像5 1girl solo blush looking_at_viewer shirt holding closed_mouth long_sleeves smile
0 12 X X X X X X X X X
搜集汇总
数据集介绍
main_image_url
构建方式
在动漫角色数据集构建领域,针对BanG Dream!中的角色toyama_asuka,本数据集通过自动化爬取系统从Danbooru、Pixiv、Zerochan等多个图像平台采集原始图像,并辅以标签信息。数据集的构建依托于DeepGHS团队开发的Waifuc框架,实现了从多源异构数据的高效整合。原始图像经过预处理,包括最小边对齐至1400像素的尺寸标准化,以及核心标签(如棕色头发、紫色眼睛、短发、刘海、发饰、发夹)的剪枝处理,从而形成结构清晰、标签精简的高质量数据集。
特点
该数据集以12张toyama_asuka角色图像为核心,规模虽小但精炼,提供了多种分辨率版本(如800像素、1200像素)以及三阶段裁剪版本(stage3-p480-800和stage3-p480-1200),以适应不同训练需求。其独特之处在于通过标签聚类分析,揭示了图像中如1girl、solo、blush、looking_at_viewer等共同语义特征,为角色识别和风格迁移提供了可挖掘的潜在模式。数据集以MIT许可证开放,确保了广泛的可访问性和复用性。
使用方法
使用该数据集时,推荐通过Waifuc库加载原始压缩包,首先从HuggingFace Hub下载dataset-raw.zip文件,解压至本地目录后利用LocalSource接口读取图像及其元数据(如文件名和标签)。用户可根据任务需求选择不同尺寸的压缩包(如800或1200像素版本)直接用于图像生成模型的训练。对于需要更精细裁剪的场景,可选用三阶段裁剪版本,其面积不低于480x480像素,以提升局部特征的捕获能力。
背景与挑战
背景概述
在生成式人工智能与动漫文化交汇的浪潮中,高质量、结构化的角色图像数据集成为驱动文本到图像生成模型发展的关键基石。由DeepGHS团队于近期创建的toyama_asuka(出自《BanG Dream!》)数据集,正是这一趋势下的典型产物。该数据集聚焦于单一动漫角色,通过从Danbooru、Pixiv、Zerochan等多源平台自动爬取,精心筛选并标注了12张核心图像,旨在为角色定制化生成任务提供纯净、低噪声的训练素材。其研究核心在于探索如何高效构建小样本、高特异性的角色图像库,以支持下游模型对特定视觉特征(如棕色短发、紫色眼眸)的精准学习与再现,对推动二次元风格生成模型的细粒度控制与个性化应用具有重要参考价值。
当前挑战
该数据集面临的挑战首先体现在领域问题层面:当前文本到图像生成模型在处理特定动漫角色时,常因训练数据中角色特征混杂而导致生成结果出现身份混淆或风格偏移,亟需纯净、标签一致的小样本数据集来提升角色保真度。在构建过程中,数据集遭遇了多重技术困难。其一,跨平台图像爬取需应对各异的反爬机制与版权过滤策略,确保数据来源的合法性与稳定性。其二,自动标注系统虽能提取核心标签,但面对同一角色在不同画师笔下呈现的细微差异(如发型角度、表情变化),仍需人工校验以避免标签噪声。其三,仅12张原始图像的规模虽利于聚焦,却难以覆盖角色的多角度、多表情与不同着装场景,限制了模型泛化能力的提升。
常用场景
经典使用场景
该数据集专为文本到图像生成任务而设计,聚焦于BanG Dream! 中的角色户山香澄。其经典使用场景在于基于扩散模型的二次元角色肖像生成,研究者可利用12张高标注图片及对应标签(如棕发、紫瞳、短发等),通过微调Stable Diffusion等预训练模型,实现对该角色形象的高保真再现。数据集还提供多种分辨率版本及三分阶段裁剪版本,便于适配不同计算资源下的训练需求,是角色定制化图像生成领域的典型小型基准。
解决学术问题
该数据集有效解决了二次元角色图像生成中数据稀缺与特征一致性两大核心学术问题。传统方法常因缺乏高质量、标签规范的角色专属数据,导致生成图像出现面部特征崩坏或风格偏移。通过提供包含核心视觉标签的精选图片,并利用waifuc工具实现标签自动化提取,该数据集为研究小样本条件下的角色概念学习、属性解耦表示以及标签噪声鲁棒性提供了标准化实验平台,推动了可控图像生成技术在虚拟角色领域的理论进展。
衍生相关工作
该数据集衍生出一系列基于角色标签聚类与少样本学习的工作。例如,研究者利用其提供的标签聚类结果(如‘blush’、‘smile’等),探索了基于文本条件的情感属性控制生成方法。同时,数据集作为CyberHarem社区角色数据集家族的一员,推动了多个开源项目的发展,包括基于DreamBooth的角色个性化微调框架、基于LoRA的轻量级角色适配技术,以及跨数据集的角色风格迁移研究,这些工作共同构建了二次元图像生成领域的基准评估体系。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作