five

CyberHarem/jinx_leagueoflegends

收藏
Hugging Face2024-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/jinx_leagueoflegends
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于《英雄联盟》角色Jinx的数据集,包含500张图片及其标签。图片来源于多个网站(如danbooru、pixiv、zerochan等),并通过DeepGHS团队的自动爬取系统获取。数据集的核心标签包括`long_hair, blue_hair, braid, twin_braids, breasts, pink_eyes, bangs, very_long_hair`。数据集提供了多种格式的下载链接,并支持通过waifuc工具加载原始数据。此外,README还提供了标签聚类结果的详细列表。

这是一个关于《英雄联盟》角色Jinx的数据集,包含500张图片及其标签。图片来源于多个网站(如danbooru、pixiv、zerochan等),并通过DeepGHS团队的自动爬取系统获取。数据集的核心标签包括`long_hair, blue_hair, braid, twin_braids, breasts, pink_eyes, bangs, very_long_hair`。数据集提供了多种格式的下载链接,并支持通过waifuc工具加载原始数据。此外,README还提供了标签聚类结果的详细列表。
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集基本信息

  • 名称: Dataset of jinx (League of Legends)
  • 许可证: MIT
  • 任务类别: text-to-image
  • 标签: art, not-for-all-audiences
  • 大小类别: n<1K

数据集内容

  • 图像数量: 500张
  • 核心标签: long_hair, blue_hair, braid, twin_braids, breasts, pink_eyes, bangs, very_long_hair

数据包列表

名称 图像数量 大小 类型 描述
raw 500 754.63 MiB Waifuc-Raw 原始数据,包含元信息(最小边对齐到1400像素,如果更大)
800 500 429.14 MiB IMG+TXT 短边不超过800像素的数据集
stage3-p480-800 1149 849.34 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素
1200 500 664.32 MiB IMG+TXT 短边不超过1200像素的数据集
stage3-p480-1200 1149 1.17 GiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素

标签聚类结果

原始文本版本

# 样本数量 图像1 图像2 图像3 图像4 图像5 标签
0 6 [图像链接] [图像链接] [图像链接] [图像链接] [图像链接] 1girl, belt, bullet, fingerless_gloves, flat_chest, looking_at_viewer, necklace, solo, tattoo, bikini_top_only, navel, single_thighhigh, character_name, gun, nail_polish, bandolier, grin, short_shorts
1 7 [图像链接] [图像链接] [图像链接] [图像链接] [图像链接] 1girl, asymmetrical_bangs, bare_shoulders, crop_top, fingerless_gloves, looking_at_viewer, navel, solo, striped_pants, holding_gun, shoulder_tattoo, arm_tattoo, stomach_tattoo, brown_belt, closed_mouth, pink_pants, sitting, small_breasts, smile
2 7 [图像链接] [图像链接] [图像链接] [图像链接] [图像链接] 1girl, arm_tattoo, asymmetrical_bangs, bare_shoulders, crop_top, fingerless_gloves, navel, solo, stomach_tattoo, striped_pants, looking_at_viewer, belt, small_breasts, blue_nails, smile, character_name, nail_polish, pink_pants, shirt, teeth
3 5 [图像链接] [图像链接] [图像链接] [图像链接] [图像链接] 1girl, arm_tattoo, asymmetrical_bangs, bare_shoulders, shoulder_tattoo, solo, brown_gloves, fingerless_gloves, green_hair, looking_at_viewer, blue_eyes, red_lips, shiny_hair, teeth, black_gloves, brown_shirt, hand_up, smile
4 5 [图像链接] [图像链接] [图像链接] [图像链接] [图像链接] 1girl, bare_shoulders, solo, upper_body, arm_tattoo, asymmetrical_bangs, closed_mouth, crop_top, looking_at_viewer, shoulder_tattoo, small_breasts, fingerless_gloves, shirt, smile, collarbone, green_hair, pink_background
5 10 [图像链接] [图像链接] [图像链接] [图像链接] [图像链接] 1girl, bare_shoulders, looking_at_viewer, red_hair, solo, star_guardian_(league_of_legends), twintails, elbow_gloves, star_(symbol), hair_ornament, magical_girl, red_eyes, fingerless_gloves, navel, alternate_costume, shorts, thighhighs, black_gloves, grin, hair_between_eyes, upper_body
6 9 [图像链接] [图像链接] [图像链接] [图像链接] [图像链接] 1girl, navel, nipples, open_mouth, nude, pussy_juice, small_breasts, solo, tattoo, blush, collarbone, tongue_out, uncensored, black_choker, dildo, spread_legs, vaginal_object_insertion, looking_at_viewer, saliva, sweat, sitting, teeth
7 9 [图像链接] [图像链接] [图像链接] [图像链接] [图像链接] 1girl, futanari, huge_penis, smile, solo, uncensored, looking_at_viewer, veiny_penis, alternate_breast_size, navel, nipples, thick_thighs, abs, huge_breasts, large_penis, sweat, arm_tattoo, large_testicles, purple_eyes, standing, nude, shiny_skin, skindentation
8 11 [图像链接] [图像链接] [图像链接] [图像链接] [图像链接] 1boy, 1girl, hetero, uncensored, solo_focus, blush, bare_shoulders, veiny_penis, looking_at_viewer, saliva, arm_tattoo, pov, shiny, tongue_out, dark-skinned_male, interracial, licking_penis, male_pubic_hair, nail_polish, nude
搜集汇总
数据集介绍
main_image_url
构建方式
在电子游戏角色数据集的构建中,金克丝(《英雄联盟》)数据集汇聚了500幅来自Danbooru、Pixiv、Zerochan等多平台的图像资源。依托DeepGHS团队开发的自动化爬取系统,原始数据经过精细的标签筛选,保留了诸如长蓝发、双辫、粉瞳等核心角色特征。数据集提供了多种处理版本:原始版包含元信息且最小边对齐至1400像素;缩放版将短边分别限制在800和1200像素;三级裁剪版则确保图像区域不小于480x480像素,并衍生出更多样本。所有版本均以压缩包形式发布,便于研究者按需选用。
特点
该数据集最显著的特点在于其层次化的结构设计与详尽的多模态标注。它不仅仅包含原始图像,更通过标签聚类技术自动挖掘出角色在不同装扮下的视觉模式,如“星之守护者”皮肤或特定姿态的集群。每个聚类都配有样本缩略图和对应的标签列表,为风格迁移或概念提取提供了天然的训练素材。数据集涵盖了从正常着装到艺术化表达的多样性内容,并明确标注了标签范围,以适应不同场景下的研究需求。
使用方法
针对不同的技术栈,数据集提供了灵活的使用途径。对于Python生态下的Waifuc框架,用户可通过Hugging Face Hub下载原始压缩包,解压后利用LocalSource加载图像及其元数据与标签,实现高效的迭代处理。此外,缩放版和裁剪版数据集可直接用于文本到图像模型的训练,而聚类结果则能辅助进行细粒度特征分析。开发者可根据任务需求选择对应的ZIP文件,通过标准的数据加载流程快速集成到工作流中。
背景与挑战
背景概述
在文本到图像生成领域,高质量、精细化标注的角色数据集对于提升生成模型的准确性与多样性至关重要。CyberHarem/jinx_leagueoflegends数据集由DeepGHS团队于近期创建,聚焦于《英雄联盟》中的经典角色“金克丝”。该数据集包含500张经过精心筛选与标注的图像,核心标签涵盖长蓝发、双辫、粉色眼眸等特征,旨在为动漫风格的角色生成任务提供标准化训练资源。通过从Danbooru、Pixiv、Zerochan等多平台自动采集并统一处理,该数据集不仅丰富了二次元角色生成的研究素材,也为跨平台图像标注的整合与统一提供了实践范例,对推动个性化角色生成与风格迁移技术的发展具有重要参考价值。
当前挑战
该数据集所解决的领域问题在于,现有通用文本到图像模型在生成特定二次元角色时,常因缺乏细粒度标签与高质量样本而出现特征混淆或风格不一致。构建过程中面临的主要挑战包括:多源图像采集时需处理版权与内容合规性,确保数据合法性;自动标注系统需准确提取并统一来自不同平台、不同标注风格的标签,避免语义冲突;数据集规模较小(不足千张),需通过多尺度裁剪(如stage3-p480-1200)与聚类分析来增强样本多样性,同时需过滤不适宜内容(如NSFW图像)以维护数据集质量。
常用场景
经典使用场景
在文本到图像生成领域,该数据集作为角色定制化微调的核心素材,常用于训练基于扩散模型的个性化生成系统。研究者通过利用其标注完备的图像与标签对,针对金克丝这一角色的标志性特征(如蓝色双辫、粉瞳、纹身等)进行模型适配,从而实现对特定虚拟形象的精准复现与风格化创作。
解决学术问题
该数据集有效解决了虚拟角色图像生成中数据稀缺与标签混乱的学术难题。通过提供高一致性、多视角、多场景的标注图像,它支撑了角色概念解耦、属性编辑与风格迁移等前沿研究,推动了可控生成模型在亚文化内容创作中的理论发展,并为评估生成图像的语义保真度提供了标准化基准。
衍生相关工作
该数据集衍生出多项经典工作,包括基于LoRA和DreamBooth的角色高效微调方法、面向多角色混合生成的标签融合策略,以及针对NSFW内容的过滤与重标注技术。此外,其聚类结果促进了服饰与姿态的自动挖掘研究,为角色多模态理解与跨域生成提供了可复现的实验平台。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作