five

CyberHarem/tang_keke_lovelivesuperstar

收藏
Hugging Face2024-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/tang_keke_lovelivesuperstar
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为tang_keke/唐可可/탕쿠쿠 (Love Live! Superstar!!)的数据集,包含500张图片及其标签。核心标签包括short_hair, bangs, blue_eyes, grey_hair, ribbon, neck_ribbon, red_ribbon,这些标签在数据集中被修剪。图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬取系统由DeepGHS团队提供。数据集提供了多个版本,包括原始数据、不同尺寸的图片以及经过裁剪的图片版本。此外,还提供了使用waifuc加载原始数据集的代码示例,并展示了标签聚类结果的列表。

This is a dataset titled tang_keke/唐可可/탕쿠쿠 (Love Live! Superstar!!), consisting of 500 images and their associated annotation tags. The core tags include short_hair, bangs, blue_eyes, grey_hair, ribbon, neck_ribbon, and red_ribbon, with non-core tags trimmed in the dataset. Images were crawled from multiple online platforms such as danbooru, pixiv, zerochan, and others, and the crawling system was provided by the DeepGHS team. Multiple variants of the dataset are available, including raw data, images with different resolutions, and cropped image versions. Additionally, code examples for loading the raw dataset using waifuc are provided, alongside a list displaying the results of tag clustering.
提供机构:
CyberHarem
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Dataset of tang_keke/唐可可/탕쿠쿠 (Love Live! Superstar!!)
  • 许可证: MIT
  • 任务类别: text-to-image
  • 标签: art, not-for-all-audiences
  • 数据量: n<1K

数据集内容

  • 图像数量: 500张
  • 核心标签: short_hair, bangs, blue_eyes, grey_hair, ribbon, neck_ribbon, red_ribbon
  • 来源: 从多个网站爬取,如danbooru, pixiv, zerochan等

数据包列表

名称 图像数量 大小 类型 描述
raw 500 736.87 MiB Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。
800 500 354.58 MiB IMG+TXT 短边不超过800像素的数据集。
stage3-p480-800 1273 821.73 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。
1200 500 621.72 MiB IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 1273 1.28 GiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

标签聚类结果

原始文本版本

# 样本数量 图像示例 标签
0 21 1girl, blue_jacket, grey_dress, long_sleeves, smile, solo, white_shirt, yuigaoka_school_uniform, collared_shirt, looking_at_viewer, open_jacket, pinafore_dress, white_background, simple_background, blush, open_mouth, breasts, multicolored_hair
1 5 1girl, black_socks, blue_jacket, brown_footwear, grey_dress, light_brown_hair, loafers, long_sleeves, looking_at_viewer, open_jacket, pinafore_dress, shiny_hair, solo, white_background, yuigaoka_school_uniform, collared_shirt, full_body, kneehighs, smile, white_shirt, simple_background, blush, medium_breasts, multicolored_hair, open_mouth, sitting
2 26 1girl, smile, solo, white_gloves, looking_at_viewer, elbow_gloves, hair_bow, open_mouth, blush, hairband, white_dress, brown_hair, pink_dress, pink_bow, puffy_short_sleeves
3 24 1girl, solo, collarbone, looking_at_viewer, outdoors, smile, navel, blush, day, bracelet, cloud, blue_sky, ocean, sun_hat, hair_ornament, bikini_skirt, flower, blue_bikini, bow, choker, frilled_bikini, medium_breasts, open_mouth

表格版本

# 样本数量 图像示例 标签
0 21 1girl, blue_jacket, grey_dress, long_sleeves, smile, solo, white_shirt, yuigaoka_school_uniform, collared_shirt, looking_at_viewer, open_jacket, pinafore_dress, white_background, simple_background, blush, open_mouth, breasts, multicolored_hair
1 5 1girl, black_socks, blue_jacket, brown_footwear, grey_dress, light_brown_hair, loafers, long_sleeves, looking_at_viewer, open_jacket, pinafore_dress, shiny_hair, solo, white_background, yuigaoka_school_uniform, collared_shirt, full_body, kneehighs, smile, white_shirt, simple_background, blush, medium_breasts, multicolored_hair, open_mouth, sitting
2 26 1girl, smile, solo, white_gloves, looking_at_viewer, elbow_gloves, hair_bow, open_mouth, blush, hairband, white_dress, brown_hair, pink_dress, pink_bow, puffy_short_sleeves
3 24 1girl, solo, collarbone, looking_at_viewer, outdoors, smile, navel, blush, day, bracelet, cloud, blue_sky, ocean, sun_hat, hair_ornament, bikini_skirt, flower, blue_bikini, bow, choker, frilled_bikini, medium_breasts, open_mouth
搜集汇总
数据集介绍
main_image_url
构建方式
在动漫角色图像数据集的构建领域,该数据集聚焦于《Love Live! Superstar!!》中的角色唐可可。其构建过程采用了自动化网络爬虫技术,从Danbooru、Pixiv、Zerochan等多个知名动漫艺术社区系统性地采集原始图像。采集后的数据经过预处理,核心角色标签如短发、蓝眼等被提取并精简,同时提供了不同分辨率的版本,包括原始尺寸、短边不超过特定像素的调整版本以及经过多阶段裁剪的版本,以满足不同计算需求下的图像质量与处理效率。
特点
该数据集的核心特点在于其高度的专题性与结构化标注。它专门收录了单一动漫角色的500张图像,确保了内容在主题上的一致性。每张图像均附有详细的元数据标签,这些标签不仅描述了角色的固有特征,还涵盖了服装、场景、动作等丰富语义信息。数据集进一步提供了基于标签的聚类分析结果,以视觉化表格形式展示了不同服饰或场景下的图像分组,这为研究角色形象的多维度表征提供了便利。数据以多种尺寸和裁剪格式打包,兼顾了研究与应用中对于图像质量与处理速度的平衡需求。
使用方法
该数据集主要服务于文本到图像生成模型的训练与评估,尤其在角色特定风格的学习方面具有应用价值。研究人员可通过Hugging Face Hub直接下载不同规格的数据包。对于需要利用完整元数据的研究,数据集支持通过Waifuc工具库进行加载,该工具能解析原始压缩包中的图像与标签信息,实现数据的结构化访问。用户可根据实验需求,选择不同分辨率的数据子集,或参考提供的聚类分析,针对特定角色姿态或服饰风格进行定向的模型微调或生成效果分析。
背景与挑战
背景概述
在动漫角色图像生成与风格化研究领域,高质量、细粒度标注的数据集对于推动文本到图像模型的精准化发展至关重要。CyberHarem/tang_keke_lovelivesuperstar数据集由DeepGHS团队构建,专注于《Love Live! Superstar!!》中的角色唐可可(Tang Keke),收录了500张图像及其对应标签。该数据集旨在为动漫风格图像的生成与识别提供专门化的训练资源,通过从Danbooru、Pixiv等平台自动化爬取图像,并经过尺寸归一化与标签修剪处理,服务于艺术创作与计算机视觉交叉领域的研究与应用。
当前挑战
该数据集致力于解决动漫角色图像生成中特定角色的风格一致性与细节还原问题,其挑战在于如何从多样化的艺术创作中提取并标准化核心视觉特征,例如角色发饰、服装与色彩元素的准确表征。在构建过程中,面临图像来源异构性带来的质量参差、标签体系与视觉内容的对齐复杂性,以及自动化爬取时可能涉及的版权与内容筛选难题,这些因素均对数据集的完整性、标注可靠性与应用普适性构成考验。
常用场景
经典使用场景
在动漫角色生成与风格迁移的研究领域中,CyberHarem/tang_keke_lovelivesuperstar数据集以其精心标注的500张唐可可角色图像,为文本到图像生成模型提供了高质量的微调素材。该数据集通过精确的标签系统,如短髮、蓝眼、灰发等核心特征,使得研究人员能够针对特定动漫角色进行高度定制化的模型训练,从而在保持角色一致性的同时探索多样化的艺术风格表达。
解决学术问题
该数据集有效应对了动漫图像生成中角色特征保持与细节还原的学术挑战。通过提供多尺寸版本与三阶段裁剪数据,它解决了生成对抗网络在训练过程中常见的分辨率限制与特征丢失问题。其结构化标签体系为跨模态学习研究提供了可量化的评估基准,推动了文本描述与视觉特征对齐算法的进步,对提升生成图像的语义准确性具有显著意义。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在动漫风格生成模型的优化与扩展。例如基于Waifuc工具链的自动化标注流程改进、针对多标签协同训练的图像生成架构创新,以及结合聚类分析的角色服饰特征挖掘研究。这些工作不仅深化了特定领域生成模型的理论基础,也为后续的动漫图像合成数据集构建提供了方法论参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作