CyberHarem/maruyama_aya_bangdream
收藏Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/maruyama_aya_bangdream
下载链接
链接失效反馈官方服务:
资源简介:
这是一个名为maruyama_aya/丸山彩/마루야마아야 (BanG Dream!)的数据集,包含500张图片及其标签。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队开发。数据集的核心标签包括pink_hair, bangs, pink_eyes, bow, twintails, ribbon, sidelocks, long_hair, hair_ribbon,这些标签在数据集中被修剪。README还提供了数据集的下载链接和使用示例代码。
This is a dataset named maruyama_aya/Maruyama Aya/마루야마아야 (from the media franchise BanG Dream!) containing 500 images and their associated labels. The images were crawled from multiple online platforms including danbooru, pixiv, zerochan and other similar sites, with the crawling system developed by the DeepGHS team. The core tags for this dataset are pink_hair, bangs, pink_eyes, bow, twintails, ribbon, sidelocks, long_hair and hair_ribbon, and all annotations in the dataset are pruned to retain these core tags. The accompanying README provides the dataset's download link and sample usage code.
提供机构:
CyberHarem
原始信息汇总
数据集概述
数据集名称
Dataset of maruyama_aya/丸山彩/마루야마아야 (BanG Dream!)
数据集描述
该数据集包含500张图像及其标签,主要描绘角色maruyama_aya/丸山彩/마루야마아야(BanG Dream!)。
核心标签
pink_hairbangspink_eyesbowtwintailsribbonsidelockslong_hairhair_ribbon
数据来源
图像从多个网站(如danbooru, pixiv, zerochan等)爬取,爬虫系统由DeepGHS Team开发。
数据集包列表
| 名称 | 图像数量 | 大小 | 类型 | 描述 |
|---|---|---|---|---|
| raw | 500 | 719.77 MiB | Waifuc-Raw | 原始数据,包含元信息(最小边对齐到1400像素,如果更大) |
| 800 | 500 | 393.44 MiB | IMG+TXT | 短边不超过800像素的数据集 |
| stage3-p480-800 | 1261 | 879.58 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 |
| 1200 | 500 | 626.71 MiB | IMG+TXT | 短边不超过1200像素的数据集 |
| stage3-p480-1200 | 1261 | 1.26 GiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 |
标签聚类结果
原始文本版本
| # | 样本数量 | 图像示例1 | 图像示例2 | 图像示例3 | 图像示例4 | 图像示例5 | 标签 |
|---|---|---|---|---|---|---|---|
| 0 | 9 | ![]() |
![]() |
![]() |
![]() |
![]() |
1girl, blush, looking_at_viewer, open_mouth, short_sleeves, solo, collarbone, polka_dot_shirt, yellow_shirt, :d, pink_bow, ;d, one_eye_closed, pink_pants |
| 1 | 18 | ![]() |
![]() |
![]() |
![]() |
![]() |
1girl, long_sleeves, solo, white_sailor_collar, hanasakigawa_school_uniform, looking_at_viewer, blush, red_ribbon, neck_ribbon, sailor_dress, white_background, brown_dress, open_mouth, simple_background, double-breasted, upper_body, :d, hair_down, medium_hair |
| ... | ... | ... | ... | ... | ... | ... | ... |
表格版本
| # | 样本数量 | 图像示例1 | 图像示例2 | 图像示例3 | 图像示例4 | 图像示例5 | 标签列(部分) |
|---|---|---|---|---|---|---|---|
| 0 | 9 | ![]() |
![]() |
![]() |
![]() |
![]() |
1girl, blush, looking_at_viewer, open_mouth, short_sleeves, solo, collarbone, polka_dot_shirt, yellow_shirt, :d, pink_bow, ;d, one_eye_closed, pink_pants |
| 1 | 18 | ![]() |
![]() |
![]() |
![]() |
![]() |
1girl, long_sleeves, solo, white_sailor_collar, hanasakigawa_school_uniform, looking_at_viewer, blush, red_ribbon, neck_ribbon, sailor_dress, white_background, brown_dress, open_mouth, simple_background, double-breasted, upper_body, :d, hair_down, medium_hair |
| ... | ... | ... | ... | ... | ... | ... | ... |
搜集汇总
数据集介绍

构建方式
该数据集名为‘CyberHarem/maruyama_aya_bangdream’,专注于BanG Dream!中的角色丸山彩。数据集包含500张图像及其相关标签,这些图像主要从danbooru、pixiv、zerochan等网站爬取,由DeepGHS团队开发的自动爬虫系统进行收集和处理。图像的标签经过精心筛选,涵盖了角色的核心特征,如粉色头发、刘海、粉色眼睛等。
特点
数据集的显著特点在于其丰富的图像多样性和详细的标签系统。每张图像都附有详细的标签,涵盖了角色的服装、发型、表情等多个方面,为研究者和开发者提供了丰富的数据资源。此外,数据集还提供了不同分辨率和处理阶段的图像包,满足不同应用场景的需求。
使用方法
使用该数据集时,用户可以通过HuggingFace平台直接下载不同版本的图像包,包括原始数据和经过处理的图像。对于需要加载原始数据的用户,可以使用waifuc工具进行加载和处理。具体操作包括下载压缩文件、解压并使用waifuc加载数据集,从而获取图像及其元信息。
背景与挑战
背景概述
在动漫与游戏文化日益繁荣的背景下,角色形象的多样化和精细化成为研究热点。CyberHarem/maruyama_aya_bangdream数据集聚焦于BanG Dream!中的角色丸山彩,由DeepGHS团队于近期创建。该数据集包含500张图像及其标签,核心标签涵盖了角色的主要特征,如粉红色头发、刘海、粉红色眼睛等。这一数据集的构建旨在为文本到图像生成任务提供高质量的训练数据,推动角色形象生成技术的发展,并对动漫角色研究领域产生积极影响。
当前挑战
该数据集在构建过程中面临多重挑战。首先,图像的多样性要求在标签生成和图像分类上具备高精度,以确保数据集的实用性和准确性。其次,从多个网站(如danbooru、pixiv、zerochan等)自动抓取图像,需要强大的爬虫技术和图像处理能力,以保证数据的质量和一致性。此外,数据集的规模虽小,但标签的精细化和多样性增加了数据处理的复杂性,如何在有限的资源下高效地处理和利用这些数据,是当前面临的主要挑战。
常用场景
经典使用场景
在动漫与艺术创作领域,CyberHarem/maruyama_aya_bangdream数据集以其丰富的图像和详细的标签系统,成为文本到图像生成任务的经典资源。该数据集包含了500张丸山彩(Maruyama Aya)的图像及其相关标签,涵盖了从发型、服装到表情等多个维度。这些图像和标签的结合,为研究人员和艺术家提供了一个详尽的素材库,用于训练和验证基于文本描述生成图像的模型。
实际应用
在实际应用中,CyberHarem/maruyama_aya_bangdream数据集被广泛用于动漫创作、角色设计以及虚拟形象生成等领域。艺术家和设计师可以利用这些数据进行灵感创作,快速生成符合特定描述的角色形象。此外,该数据集还被用于开发智能创作工具,帮助用户通过简单的文本描述自动生成复杂的动漫角色图像,极大地提高了创作效率和质量。
衍生相关工作
基于CyberHarem/maruyama_aya_bangdream数据集,许多相关研究和工作得以展开。例如,有研究者利用该数据集开发了新的图像生成算法,显著提升了生成图像的细节和逼真度。此外,还有工作专注于标签系统的优化,以提高文本描述与图像生成之间的匹配度。这些衍生工作不仅丰富了数据集的应用场景,也为相关领域的技术进步提供了有力支持。
以上内容由遇见数据集搜集并总结生成













