five

CyberHarem/hanazono_tae_bangdream

收藏
Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/hanazono_tae_bangdream
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为hanazono_tae/花園たえ (BanG Dream!)的数据集,包含283张图片及其标签。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队提供。数据集的核心标签包括`long_hair, green_eyes, bangs, black_hair, brown_hair, hair_between_eyes`,这些标签在数据集中被修剪。

This is a dataset named hanazono_tae/花園たえ (BanG Dream!), which contains 283 images paired with their corresponding tags. The images were crawled from various online platforms such as danbooru, pixiv, zerochan and other similar sites, and the crawling system was provided by the DeepGHS team. The core tags of this dataset include `long_hair, green_eyes, bangs, black_hair, brown_hair, hair_between_eyes`, and these tags have been pruned in the dataset.
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集名称

Dataset of hanazono_tae/花園たえ (BanG Dream!)

数据集描述

该数据集包含283张图片及其标签,主要描述角色hanazono_tae/花園たえ(BanG Dream!)。核心标签包括long_hair, green_eyes, bangs, black_hair, brown_hair, hair_between_eyes

数据来源

图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬虫系统由DeepGHS Team开发。

数据集包列表

名称 图片数量 大小 下载链接 类型 描述
raw 283 338.59 MiB Download Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。
800 283 206.58 MiB Download IMG+TXT 短边不超过800像素的数据集。
stage3-p480-800 625 407.75 MiB Download IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。
1200 283 301.21 MiB Download IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 625 559.73 MiB Download IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

标签聚类结果

原始文本版本

# Samples Img-1 Img-2 Img-3 Img-4 Img-5 Tags
0 9 electric_guitar, plectrum, smile, 1girl, looking_at_viewer, solo, star_(symbol), black_footwear, cross-laced_footwear, holding_instrument, striped, blue_skirt, full_body, knee_boots, bass_guitar, frills, blue_headwear, bow, character_name, hat, necktie, shirt
1 7 1girl, looking_at_viewer, open_mouth, solo, :d, blush, collarbone, simple_background, white_background, long_sleeves, upper_body, pink_shirt, black_choker
2 7 1girl, brown_dress, double-breasted, hanasakigawa_school_uniform, long_sleeves, looking_at_viewer, neck_ribbon, red_ribbon, sailor_dress, smile, solo, blush, white_sailor_collar, sidelocks, upper_body, closed_mouth, collarbone, simple_background, white_background
3 6 1girl, blush, brown_dress, hanasakigawa_school_uniform, long_sleeves, neck_ribbon, red_ribbon, sailor_dress, solo, double-breasted, looking_at_viewer, white_sailor_collar, black_socks, brown_footwear, electric_guitar, full_body, kneehighs, pleated_dress, sidelocks, smile, standing, holding, loafers, plectrum, red_bowtie, simple_background, white_background
4 8 1girl, blue_dress, hair_bow, puffy_short_sleeves, solo, wrist_cuffs, blush, vertical-striped_dress, alice_(alice_in_wonderland)(cosplay), black_bow, looking_at_viewer, earrings, frilled_apron, holding, neck_ribbon, playing_card, smile, white_apron, black_ribbon, flower, frilled_dress, guitar, hairband, mushroom, open_mouth, simple_background, spade(shape), sparkle, very_long_hair, white_background
5 12 detached_collar, fake_animal_ears, playboy_bunny, rabbit_ears, 1girl, looking_at_viewer, solo, strapless_leotard, bare_shoulders, black_leotard, cleavage, medium_breasts, wrist_cuffs, pantyhose, blush, hairband, rabbit_tail, simple_background, smile, black_bowtie, covered_navel, fishnets, full_body, high_heels, thighhighs, white_background
6 10 smile, 1girl, solo, electric_guitar, looking_at_viewer, blush, earrings, hair_flower, ribbon, bowtie, holding, blue_rose, striped, gloves, short_sleeves
7 8 day, outdoors, blue_sky, cloud, looking_at_viewer, navel, ocean, 1girl, beach, blush, collarbone, smile, solo, blue_bikini, barefoot, cleavage, medium_breasts, open_mouth, small_breasts, standing, water, sitting, tree

表格版本

# Samples Img-1 Img-2 Img-3 Img-4 Img-5 electric_guitar plectrum smile 1girl looking_at_viewer solo star_(symbol) black_footwear cross-laced_footwear holding_instrument striped blue_skirt full_body knee_boots bass_guitar frills blue_headwear bow character_name hat necktie shirt open_mouth :d blush collarbone simple_background white_background long_sleeves upper_body pink_shirt black_choker brown_dress double-breasted hanasakigawa_school_uniform neck_ribbon red_ribbon sailor_dress white_sailor_collar sidelocks closed_mouth black_socks brown_footwear kneehighs pleated_dress standing holding loafers red_bowtie blue_dress hair_bow puffy_short_sleeves wrist_cuffs vertical-striped_dress alice_(alice_in_wonderland)_(cosplay) black_bow earrings frilled_apron playing_card white_apron black_ribbon flower frilled_dress guitar hairband mushroom spade_(shape) sparkle very_long_hair detached_collar fake_animal_ears playboy_bunny rabbit_ears strapless_leotard bare_shoulders black_leotard cleavage medium_breasts pantyhose rabbit_tail black_bowtie covered_navel fishnets high_heels thighhighs hair_flower ribbon bowtie blue_rose gloves short_sleeves day outdoors blue_sky cloud navel ocean beach blue_bikini barefoot small_breasts water sitting tree
0 9 X X X X X X X X X X X X X X X X X X X X X X
1 7 X X X X X X X X X X X X X
2 7 X X X X X X X X X X X X X X X X X X X
搜集汇总
数据集介绍
main_image_url
构建方式
在动漫角色图像数据集的构建领域,CyberHarem/hanazono_tae_bangdream 数据集通过自动化爬虫系统精心采集而成。该系统从 Danbooru、Pixiv、Zerochan 等多个知名动漫艺术社区系统性地抓取了 283 张以《BanG Dream!》中角色花園たえ为主题的图像。原始数据经过预处理,将长边统一对齐至1400像素以内,并剔除了角色核心标签(如长发、绿瞳等),以确保数据集的多样性与标注的清晰度,最终形成了包含图像与对应标签的结构化集合。
特点
该数据集在动漫风格文本到图像生成任务中展现出鲜明的特色。其核心在于提供了同一角色在不同场景、服饰与姿态下的高质量视觉表现,涵盖了从校服、演出装到主题cosplay在内的多种装扮。数据集附有精细的标签体系,不仅标注了基础的人物属性,还详细描述了服装细节、道具及场景元素。尤为突出的是,数据提供了经过三阶段裁剪的不同分辨率版本(如480-800像素、480-1200像素),并附有基于标签聚类的样本分组,这为模型学习角色的一致性与多样性特征提供了结构化的视觉语义对应关系。
使用方法
针对文本到图像生成的研究与应用,该数据集提供了灵活的使用途径。研究者可通过下载不同规格的压缩包(如原始数据、固定短边尺寸版本或三阶段裁剪版本)直接获取配对的图像-文本数据。对于需要利用元数据进行高级处理的场景,数据集支持通过 Waifuc 工具库加载原始压缩包,从而访问完整的图像文件及其关联的标签元信息。这种设计使得该数据集既可用于直接的模型训练,也适用于需要对图像来源、标签构成进行深入分析与预处理的研究工作。
背景与挑战
背景概述
在动漫角色图像生成与风格化研究的蓬勃发展中,针对特定虚拟角色的高质量图像数据集成为推动文本到图像生成模型精细化发展的重要基石。CyberHarem/hanazono_tae_bangdream数据集聚焦于《BanG Dream!》系列中的角色花園たえ,由DeepGHS团队通过自动化爬虫系统从多个主流二次元艺术平台采集构建。该数据集的核心使命在于为角色特定化的生成模型训练提供精准的图文配对样本,其构建过程体现了对动漫角色特征解构与视觉概念对齐的前沿探索,旨在提升生成图像在角色一致性与细节忠实度上的表现,对二次元内容生成领域的模型微调与个性化应用具有显著的支撑价值。
当前挑战
该数据集致力于解决动漫角色特定化图像生成中的关键挑战,即如何在生成过程中精确捕捉并维持角色的标志性视觉特征(如发色、瞳色、服装等)与多样姿态、场景之间的平衡。构建过程中的挑战主要体现在多源数据整合与标注质量控制上:从Danbooru、Pixiv等异构平台爬取的图像在风格、分辨率、标签体系上存在显著差异,需进行复杂的去重、标准化与核心标签提炼;同时,自动化采集难以完全规避版权模糊或内容不适配的样本,需依赖后续清洗流程确保数据的合法性与训练有效性。
常用场景
经典使用场景
在动漫角色生成与风格化图像合成领域,该数据集作为高质量、精细标注的二次元角色图像资源,常被用于训练文本到图像的生成模型。通过提供特定角色花園たえ的多样化视觉样本及其结构化标签,研究者能够探索生成对抗网络或扩散模型在保持角色一致性、细节还原以及多姿态生成方面的性能。数据集中的图像经过尺寸优化与裁剪处理,便于模型学习不同分辨率下的特征表示,为动漫风格图像的自动化创作奠定了数据基础。
解决学术问题
该数据集针对动漫图像生成研究中角色特征保持与标签对齐的难题提供了解决方案。其精细的元数据标注有助于缓解生成模型中的语义漂移问题,使模型能够更准确地理解并复现角色的发色、服饰、配饰等视觉属性。在跨域风格迁移与少样本学习任务中,该数据集支持研究者验证模型在有限数据下捕捉角色本质特征的能力,推动了可控图像生成技术在动漫领域的算法进步与理论深化。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在动漫风格生成模型的优化与评估框架构建上。例如,基于标签聚类结果的属性解耦研究,促进了角色特征可控生成技术的发展;结合waifuc等数据处理工具链的工作,提升了动漫图像数据集的预处理与增强流程效率。此外,该数据集常被用作基准数据,用于比较不同生成模型在二次元角色图像合成任务上的保真度与多样性,推动了领域内评估标准的完善。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作