CyberHarem/miss_fortune_leagueoflegends
收藏Hugging Face2024-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/miss_fortune_leagueoflegends
下载链接
链接失效反馈官方服务:
资源简介:
这是一个名为miss_fortune (League of Legends)的数据集,包含412张图片及其标签。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队开发。数据集的核心标签包括`long_hair, breasts, red_hair, large_breasts, hat, blue_eyes`。数据集提供了多种下载选项,包括原始数据、不同尺寸的图片以及经过裁剪的图片。此外,还提供了如何使用waifuc加载原始数据集的代码示例,以及标签聚类结果的展示。
This is the dataset of miss_fortune (League of Legends), containing 412 images and their tags. The core tags of this character are `long_hair, breasts, red_hair, large_breasts, hat, blue_eyes`, which are pruned in this dataset. Images are crawled from many sites (e.g. danbooru, pixiv, zerochan ...), the auto-crawling system is powered by [DeepGHS Team](https://github.com/deepghs)([huggingface organization](https://huggingface.co/deepghs)). The dataset provides multiple versions of images, including raw data and cropped versions in different sizes, along with detailed tag clustering results.
提供机构:
CyberHarem
原始信息汇总
数据集概述
数据集基本信息
- 名称: Dataset of miss_fortune (League of Legends)
- 许可: MIT
- 任务类别: text-to-image
- 标签: art, not-for-all-audiences
- 大小类别: n<1K
- 图像数量: 412
核心标签
long_hair, breasts, red_hair, large_breasts, hat, blue_eyes
数据集包列表
| 名称 | 图像数量 | 大小 | 类型 | 描述 |
|---|---|---|---|---|
| raw | 412 | 558.24 MiB | Waifuc-Raw | 原始数据,包含元信息(最小边对齐到1400像素,如果更大) |
| 800 | 412 | 331.30 MiB | IMG+TXT | 短边不超过800像素的数据集 |
| stage3-p480-800 | 930 | 650.92 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 |
| 1200 | 412 | 498.49 MiB | IMG+TXT | 短边不超过1200像素的数据集 |
| stage3-p480-1200 | 930 | 892.78 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 |
标签聚类结果
原始文本版本
| # | 样本数量 | 图像示例 | 标签 |
|---|---|---|---|
| 0 | 6 | 5张图像 | 1girl, bare_shoulders, cleavage, gun, midriff, navel, pirate_hat, solo, detached_sleeves, looking_at_viewer, pants, dual_wielding, simple_background, smile, white_background, hair_over_one_eye, very_long_hair |
| 1 | 13 | 5张图像 | 1girl, navel, solo, midriff, pirate_hat, cleavage, dual_wielding, boots, handgun |
| 2 | 5 | 5张图像 | 1girl, belt, pirate_hat, cleavage, looking_at_viewer, solo, choker, dual_wielding, antique_firearm, boots, freckles, holding_gun, lips, single_braid |
| 3 | 7 | 5张图像 | 1girl, bare_shoulders, solo, bangs, black_headwear, cleavage, pirate_hat, freckles, holding_gun, shiny_hair, black_pants, collarbone, earrings, green_eyes, medium_breasts, smile, brown_belt, teeth |
| 4 | 13 | 5张图像 | 1girl, cleavage, solo, garter_straps, thighhighs, choker, pinstripe_suit, looking_at_viewer, pencil_skirt, skirt_suit, smile, submachine_gun |
| 5 | 22 | 5张图像 | 1girl, solo, one-piece_swimsuit, sun_hat, hoop_earrings, sunglasses, bracelet, looking_at_viewer, cleavage_cutout, heart-shaped_eyewear, outdoors, looking_over_eyewear, blue-tinted_eyewear, day, armlet, bare_shoulders, smile, navel_cutout, thighs, sky |
| 6 | 10 | 5张图像 | 1girl, looking_at_viewer, nipples, solo, pussy, day, ocean, beach, cloud, outdoors, sky, completely_nude, navel, parted_lips, sitting, water, ass, earrings, green_eyes, shiny_skin, uncensored, blush, collarbone, pirate_hat, thighs |
| 7 | 10 | 5张图像 | 1girl, 1boy, hetero, nipples, penis, uncensored, open_mouth, pirate_hat, solo_focus, freckles, green_eyes, red_lips, sex, vaginal, blush, completely_nude, navel, pov, shiny_skin, armpits, looking_at_viewer, sweat, cum_in_pussy, girl_on_top, hoop_earrings, lying, spread_legs, straddling |
搜集汇总
数据集介绍

构建方式
在数字艺术与游戏角色生成领域,数据集的构建需兼顾内容的丰富性与标注的精确性。本数据集围绕《英雄联盟》中的角色“厄运小姐”展开,通过自动化爬虫系统从Danbooru、Pixiv、Zerochan等多个知名艺术平台系统性地采集了412幅图像。采集过程中,原始图像均附有详细的元数据标签,并经过预处理,包括对核心标签的筛选与修剪,确保数据质量。图像尺寸经过标准化处理,提供了从原始分辨率到多种缩放版本的衍生数据包,以适应不同计算需求。
特点
该数据集的核心特征在于其高度的专业性与结构化组织。所有图像均经过精细标注,标签体系涵盖了角色外观、服饰、姿态及场景等多维度属性,为文本到图像生成任务提供了丰富的语义信息。数据集提供了多种预处理版本,包括边缘对齐至1400像素的原始数据、短边不超过800或1200像素的缩放版本,以及经过三阶段裁剪的增强子集,满足不同模型训练对图像尺寸与细节的要求。此外,数据集中还包含了基于标签聚类的结果,揭示了角色在不同服饰与场景下的视觉模式,为风格化生成研究提供了有力支撑。
使用方法
为便于研究者高效利用,数据集支持多种加载方式。用户可直接下载提供的ZIP压缩包,获取图像与对应文本标签的配对文件。对于需要更灵活数据处理的场景,推荐使用Waifuc工具库进行加载,该工具支持从本地解压的原始数据中读取图像及其元数据,便于进行流水线式的数据清洗与增强操作。数据集中不同尺寸版本的图像包可直接用于训练视觉生成模型,而聚类分析结果则有助于针对特定视觉特征进行定向采样或模型微调,从而优化生成效果与多样性。
背景与挑战
背景概述
在数字艺术与生成式人工智能蓬勃发展的时代,针对特定虚拟角色的高质量图像数据集成为推动风格化文本到图像生成研究的关键资源。CyberHarem/miss_fortune_leagueoflegends数据集应运而生,专注于《英雄联盟》中的角色“厄运小姐”。该数据集由DeepGHS团队构建,通过自动化爬虫系统从Danbooru、Pixiv等多个知名艺术社区采集了412幅图像及其对应标签,并进行了精心的预处理与多版本封装。其核心旨在为角色一致性图像生成、细粒度属性控制等研究问题提供结构化数据支撑,对动漫风格图像生成领域的技术迭代与创意表达具有显著意义。
当前挑战
该数据集致力于解决动漫风格角色图像生成中,对特定角色进行高保真、多姿态与属性可控合成的挑战。这要求模型不仅能捕捉角色的标志性外观特征,还需理解并组合复杂的服饰、场景与风格元素。在构建过程中,面临多重挑战:首先,从异构网络源爬取的图像在质量、画风、分辨率上存在显著差异,需进行严格的清洗、去重与标准化对齐;其次,自动化标签系统需准确识别并修剪核心与边缘属性标签,以平衡数据的丰富性与噪声控制;此外,数据集中包含成人内容,对数据的合规使用与伦理审查提出了额外要求。
常用场景
经典使用场景
在数字艺术与生成式人工智能领域,角色特定图像数据集为风格化视觉内容的创作提供了关键支撑。CyberHarem/miss_fortune_leagueoflegends数据集聚焦于《英雄联盟》中“厄运小姐”这一角色,其经典使用场景在于训练文本到图像的生成模型。通过412张精心标注的图像及丰富的元数据标签,研究者能够构建针对该游戏角色的高保真生成系统,实现从自然语言描述到定制化角色图像的精准转换,尤其在动漫风格人物绘制方面展现出显著优势。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在生成对抗网络的改进与标签增强学习领域。DeepGHS团队基于此类数据开发的waifuc工具链已成为动漫风格图像处理的代表性框架。后续研究多集中于利用其聚类标注信息进行半监督学习优化,以及探索多标签条件下生成模型的细粒度控制能力。这些工作共同推动了角色中心化数据集在生成式人工智能中的标准化应用范式。
数据集最近研究
最新研究方向
在数字艺术与生成式人工智能的交叉领域,针对特定游戏角色的图像数据集正成为研究热点。以《英雄联盟》角色“厄运小姐”为焦点的数据集,凭借其精细的标签体系与多尺度图像资源,为角色一致性生成、风格化迁移及内容安全过滤等前沿方向提供了关键数据支撑。该数据集的结构化标注与聚类分析,尤其助力于探究生成模型在保持角色核心特征(如服饰、姿态)时的可控性与泛化能力。随着AIGC技术在游戏美术、虚拟偶像等产业的深度应用,此类高质量、细粒度标注的专用数据集,对提升生成内容的准确性、多样性与合规性具有显著意义,并推动了社区在可解释性AI与内容审核技术方面的协同发展。
以上内容由遇见数据集搜集并总结生成



