five

CyberHarem/fukumaru_koito_theidolmstershinycolors

收藏
Hugging Face2024-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/fukumaru_koito_theidolmstershinycolors
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为fukumaru_koito/福丸小糸 (THE iDOLM@STER: SHINY COLORS),包含500张图片及其标签。图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬取系统由DeepGHS团队开发。数据集中还提供了不同尺寸和裁剪方式的图片包,并详细列出了每个包的图片数量、大小和下载链接。此外,README还提供了如何使用waifuc加载原始数据集的代码示例,并展示了标签聚类结果。
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集名称

Dataset of fukumaru_koito/福丸小糸 (THE iDOLM@STER: SHINY COLORS)

数据集描述

该数据集包含500张图像及其标签,主题为fukumaru_koito/福丸小糸(《偶像大师:闪耀色彩》中的角色)。图像主要标签包括black_hair, twintails, purple_eyes, bangs, ribbon, fangs, hair_ornament, skin_fangs

数据来源

图像从多个网站(如danbooru, pixiv, zerochan等)爬取,爬虫系统由DeepGHS Team提供支持。

数据集包列表

名称 图像数量 大小 下载链接 类型 描述
raw 500 795.45 MiB Download Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。
800 500 429.66 MiB Download IMG+TXT 短边不超过800像素的数据集。
stage3-p480-800 1223 925.92 MiB Download IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。
1200 500 689.64 MiB Download IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 1223 1.34 GiB Download IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素。

数据集加载

提供原始数据集(包括标记图像)供waifuc加载。加载代码如下:

python import os import zipfile from huggingface_hub import hf_hub_download from waifuc.source import LocalSource

下载原始归档文件

zip_file = hf_hub_download( repo_id=CyberHarem/fukumaru_koito_theidolmstershinycolors, repo_type=dataset, filename=dataset-raw.zip, )

提取文件到指定目录

dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)

使用waifuc加载数据集

source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])

标签聚类列表

原始文本版本

# 样本数量 图像1 图像2 图像3 图像4 图像5 标签
0 9 1girl, black_ribbon, blazer, grey_jacket, hair_flower, looking_at_viewer, neck_ribbon, school_uniform, solo, upper_body, white_shirt, open_mouth, simple_background, white_background, long_sleeves
1 18 1girl, grey_skirt, looking_at_viewer, neck_ribbon, plaid_skirt, pleated_skirt, school_uniform, solo, grey_jacket, white_shirt, black_ribbon, blazer, hair_flower, miniskirt, open_mouth, white_background, long_sleeves, simple_background, smile, blush
2 7 1girl, long_sleeves, looking_at_viewer, plaid_skirt, solo, white_shirt, backpack, facial_mark, hairclip, miniskirt, open_mouth, animal_bag, pleated_skirt, smile, blush, hair_ribbon, heart, pink_skirt, sitting, white_background, earrings, hair_bow, sleeves_past_wrists
3 8 1girl, looking_at_viewer, solo, upper_body, long_sleeves, open_mouth, simple_background, white_background, blush, smile, hair_ribbon, hairclip, low_twintails, medium_hair, white_shirt
4 6 1girl, hair_ribbon, looking_at_viewer, open_mouth, sailor_collar, solo, white_shirt, long_sleeves, neckerchief, sailor_hat, see-through_sleeves, miniskirt, purple_skirt, white_background
5 14 1girl, hair_ribbon, sailor_collar, short_sleeves, white_shirt, solo, blue_skirt, looking_at_viewer, blue_ribbon, miniskirt, open_mouth, air_bubble, blush, underwater, socks, white_background
6 8 1girl, looking_at_viewer, solo, long_sleeves, low_twintails, belt, hair_ribbon, open_mouth, see-through_sleeves, nail_polish, purple_nails, dress, umbrella
7 9 1girl, hair_ribbon, plaid_dress, blue_shirt, open_mouth, solo, yellow_dress, hairclip, long_sleeves, looking_at_viewer, shoulder_bag, handbag, blush, :d, outdoors, x_hair_ornament
8 21 1girl, solo, looking_at_viewer, white_dress, angel_wings, flower_wreath, hair_flower, feathered_wings, necklace, white_background, wrist_cuffs, bare_shoulders, upper_body, open_mouth, head_wreath, simple_background
9 19 1girl, looking_at_viewer, solo, blush, bare_shoulders, bare_arms, small_breasts, white_background, simple_background, collarbone, navel, open_mouth, hair_ribbon, side-tie_bikini_bottom, white_bikini
10 15 1girl, navel, blush, small_breasts, nipples, sweat, completely_nude, hetero, open_mouth, pussy, solo_focus, censored, looking_at_viewer, penis, 1boy, sex, spread_legs, vaginal, on_back, female_pubic_hair
11 6 1girl, looking_at_viewer, pink_kimono, solo, double_bun, floral_print, hair_flower, obi, upper_body, wide_sleeves, blurry, bow, open_mouth, smile
12 6 1girl, bare_shoulders, black_pantyhose, blush, detached_collar, fake_animal_ears, looking_at_viewer, playboy_bunny, rabbit_ears, small_breasts, solo, strapless_leotard, bowtie, white_background, simple_background, wrist_cuffs, black_leotard, covered_navel, hairband, open_mouth, rabbit_tail
搜集汇总
数据集介绍
main_image_url
构建方式
在动漫角色数据集构建的实践中,该数据集聚焦于《偶像大师 闪耀色彩》中的角色福丸小糸,收录了来自Danbooru、Pixiv、Zerochan等多个图像社区的500张图片及其对应标签。数据采集由DeepGHS团队开发的自动化爬取系统完成,并提供了多种处理版本以满足不同应用需求。原始数据(raw)保留了元信息且最小边长对齐至1400像素;此外,还生成了短边不超过800像素和1200像素的压缩版本。为提升训练质量,数据集引入了三阶段裁剪策略(stage3),生成面积不低于480×480像素的裁剪版本,有效扩充了样本数量至1223张。
特点
该数据集具有鲜明的结构化特征,核心标签体系围绕角色外观设定,包括黑发、双马尾、紫瞳、刘海、丝带、虎牙等关键属性,并在数据集中进行了精简处理。所有图像均经过标签聚类分析,形成了如校服装扮、泳装造型、和服款式以及特定场景(如水下)等多个语义簇,便于用户针对不同风格或服饰进行筛选。数据集还覆盖了从日常便服到舞台演出服、从清纯风格到成熟主题的多样化视觉呈现,为文本到图像生成模型提供了丰富的风格维度。
使用方法
数据集的使用方式灵活多样。用户可直接通过HuggingFace Hub下载ZIP压缩包,解压后获得图像与对应TXT标签文件。对于希望深度集成工作流的开发者,数据集原生支持waifuc库加载,通过调用`hf_hub_download`下载原始归档文件,再利用`LocalSource`接口即可逐项读取图像、文件名及标签元数据。此外,数据集提供的不同分辨率版本(800/1200)和裁剪版本(stage3)可适配从快速原型验证到高精度模型训练的多种计算资源场景。
背景与挑战
背景概述
该数据集由CyberHarem团队于近期构建,聚焦于《偶像大师:闪耀色彩》中的角色福丸小糸。作为一款面向文本到图像生成任务的数据集,它收录了500张经过精细标注的角色图像,并提供了多种分辨率与裁剪版本,旨在为二次元角色生成领域提供高质量的训练素材。数据集的核心价值在于其系统化的标签体系与多源采集策略,涵盖了从校服、泳装到和服等多样化的角色装扮,为研究角色一致性生成、风格迁移等课题奠定了数据基础。其影响力体现在为AI艺术创作社区提供了标准化资源,尤其推动了动漫风格生成模型的精细化发展。
当前挑战
当前数据集面临多重挑战。首先,在领域问题层面,如何从有限样本中学习角色外观的泛化特征,避免生成结果陷入过拟合或风格单一化,是文本到图像模型的核心难题。其次,构建过程中,跨平台(如Danbooru、Pixiv)爬取图像虽丰富了内容,但带来了版权合规性与图像质量不均的隐患;自动标注系统虽高效,却可能因标签噪声(如误标或遗漏)影响训练效果。此外,数据集仅包含500张原始图像,规模较小,难以支撑复杂场景下的鲁棒生成,而裁剪与缩放版本虽增加了多样性,却可能引入构图信息损失,进一步加剧了模型对细节保真度的挑战。
常用场景
经典使用场景
该数据集聚焦于《偶像大师 闪耀色彩》中的角色福丸小糸,收录了500张经过精细标注的图像。在文本到图像生成领域,它常被用作微调扩散模型或生成对抗网络的训练素材,尤其适用于学习特定角色的视觉特征——如黑色双马尾、紫色眼眸、虎牙与发饰等核心标签。研究者通过该数据集实现角色一致性生成,探索在动漫风格下如何从标签到图像进行精准映射,成为角色定制化生成任务中的基准资源之一。
衍生相关工作
该数据集衍生出多项经典工作,包括基于Waifuc框架的图像自动爬取与标注管线,以及通过聚类分析挖掘角色服装子集的标签体系。后续研究进一步将其与DreamBooth、LoRA等微调方法结合,实现了单一角色在多种风格下的迁移生成。此外,数据集中分阶段裁剪(stage3-cropped)策略启发了针对动漫图像的高效数据增强方案,被后续多个角色数据集(如CyberHarem系列)采纳为标准化预处理流程。
数据集最近研究
最新研究方向
在二次元角色生成与文本到图像转换领域,CyberHarem/fukumaru_koito_theidolmstershinycolors 数据集聚焦于《偶像大师:闪耀色彩》中福丸小糸这一角色的精细化视觉表征学习。当前前沿方向正从粗粒度角色识别转向多模态语义对齐与细粒度属性解耦,该数据集通过提供包含黑发、双马尾、紫瞳、虎牙等核心标签的500张高质量图像及聚类分析,为研究角色特征的可控生成、风格迁移以及少样本学习提供了宝贵资源。其自动爬取与多尺度裁剪流程反映了数据工程在动漫图像处理中的自动化趋势,而聚类结果揭示了不同服饰与场景下的视觉模式,有助于推动个性化内容生成与虚拟角色交互技术的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作