five

CyberHarem/collei_genshin

收藏
Hugging Face2024-03-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/collei_genshin
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为collei/コレイ/柯莱 (Genshin Impact)的数据集,包含500张图像及其标签。核心标签包括绿色头发、紫色眼睛等,这些标签在数据集中被修剪。图像从多个网站爬取,如danbooru、pixiv、zerochan等,爬取系统由DeepGHS团队提供。数据集中还列出了不同的包及其描述,包括原始数据包、1200像素限制的数据包和三阶段裁剪的数据包。此外,还提供了如何使用waifuc加载原始数据集的代码示例,并展示了标签聚类结果的列表。

这是一个名为collei/コレイ/柯莱 (Genshin Impact)的数据集,包含500张图像及其标签。核心标签包括绿色头发、紫色眼睛等,这些标签在数据集中被修剪。图像从多个网站爬取,如danbooru、pixiv、zerochan等,爬取系统由DeepGHS团队提供。数据集中还列出了不同的包及其描述,包括原始数据包、1200像素限制的数据包和三阶段裁剪的数据包。此外,还提供了如何使用waifuc加载原始数据集的代码示例,并展示了标签聚类结果的列表。
提供机构:
CyberHarem
原始信息汇总

数据集概述

名称: Dataset of collei/コレイ/柯莱 (Genshin Impact)

描述: 该数据集包含500张关于角色collei/コレイ/柯莱(来自Genshin Impact)的图像及其标签。

核心标签: green_hair, purple_eyes, hair_ornament, hair_between_eyes, earrings, medium_hair, ahoge, long_hair, breasts

数据来源: 图像从多个网站(如danbooru, pixiv, zerochan等)自动爬取,使用DeepGHS Team开发的系统。

许可证: MIT

任务类别: text-to-image

标签: art, not-for-all-audiences

大小类别: n<1K

数据集包列表

名称 图像数量 大小 下载链接 类型 描述
raw 500 881.44 MiB 下载 Waifuc-Raw 包含元信息的原始数据(最小边对齐到1400像素,如果更大)。
1200 500 748.81 MiB 下载 IMG+TXT 短边不超过1200像素的数据集。
stage3-p480-1200 1217 1.44 GiB 下载 IMG+TXT 三阶段裁剪数据集,区域不小于480x480像素。

数据集加载示例

使用waifuc加载原始数据集的示例代码:

python import os import zipfile

from huggingface_hub import hf_hub_download from waifuc.source import LocalSource

下载原始档案文件

zip_file = hf_hub_download( repo_id=CyberHarem/collei_genshin, repo_type=dataset, filename=dataset-raw.zip, )

提取文件到目录

dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)

使用waifuc加载数据集

source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])

标签聚类列表

数据集提供了标签聚类结果,可能包含可挖掘的服装信息。以下是部分聚类样本的标签列表:

# 样本数 标签(部分)
0 6 1girl, closed_mouth, green_capelet, long_sleeves, looking_at_viewer, solo, crossed_bangs, dress, smile, single_earring, upper_body, blush, bridal_gauntlets
1 29 1girl, green_capelet, black_dress, solo, looking_at_viewer, brown_thighhighs, smile, blush, crossed_bangs, detached_sleeves, puffy_long_sleeves, single_earring, thighlet, bridal_gauntlets, simple_background, closed_mouth, white_background, open_mouth
2 7 1girl, blush, green_capelet, solo, crossed_bangs, simple_background, upper_body, closed_mouth, looking_at_viewer, single_earring, white_background, holding
3 20 1girl, looking_at_viewer, solo, green_capelet, black_dress, jewelry, holding_bow_(weapon), closed_mouth, detached_sleeves, puffy_long_sleeves, vision_(genshin_impact), brown_thighhighs, bridal_gauntlets, gloves
4 10 1girl, black_panties, from_behind, looking_at_viewer, looking_back, solo, thighs, blush, green_capelet, ass_focus, cameltoe, detached_sleeves, long_sleeves, sweat, huge_ass, closed_mouth, crossed_bangs, single_earring, thong, black_thighhighs, partially_visible_vulva, sideboob, tassel, backless_outfit
5 9 1boy, 1girl, hetero, nipples, open_mouth, penis, pussy, sex, spread_legs, vaginal, blush, medium_breasts, navel, nude, single_earring, uncensored, large_breasts, brown_thighhighs, erection, looking_at_viewer
6 6 1girl, long_sleeves, eyewear_on_head, fingerless_gloves, holding_pen, solo, white_jacket, backpack, closed_mouth, notepad, open_clothes, outdoors, paper, shirt, black_pants, goggles_on_head, jewelry
7 6 1girl, blush, navel, nipples, nude, pussy, spread_legs, single_earring, sitting, solo, anus, looking_at_viewer, female_masturbation, medium_breasts, mosaic_censoring, open_mouth, small_breasts
8 15 1girl, alternate_costume, bare_shoulders, blush, crossed_bangs, jewelry, looking_at_viewer, sleeveless_dress, solo, halter_dress, large_breasts, thighs, smile, cleavage, closed_mouth, bare_arms, sweat, covered_navel, outdoors, clothing_cutout, medium_breasts, alternate_breast_size, armpit_crease, sideboob, sitting, very_long_hair, building
9 5 1girl, blush, erection, futanari, large_breasts, large_penis, mosaic_censoring, navel, nipples, solo, stomach, testicles, thighs, alternate_breast_size, closed_mouth, cowboy_shot, crossed_bangs, female_pubic_hair, looking_at_viewer, single_earring, veiny_penis, armpits, arms_behind_head, arms_up, black_sleeves, choker, collarbone, completely_nude, detached_sleeves, huge_breasts, long_sleeves, open_mouth, outdoors, patreon_username, water, wet
10 5 1girl, beach, blue_sky, blush, cloud, day, looking_at_viewer, navel, ocean, outdoors, solo, stomach, string_bikini, thighs, water, wet, collarbone, halterneck, side-tie_bikini_bottom, sitting, tassel, alternate_costume, black_bikini, black_jacket, crossed_bangs, green_capelet, hand_up, long_sleeves, medium_breasts, open_jacket, parted_lips, single_earring, smile, tree, arm_support, black_choker, cameltoe, cleavage, closed_mouth, cowboy_shot, green_bikini, knee_up, large_breasts, off_shoulder, sweat
11 7 1girl, :d, ass, beach, cowboy_shot, crossed_bangs, jewelry, looking_at_viewer, looking_back, open_mouth, outdoors, side-tie_bikini_bottom, thighs, water, bare_shoulders, blue_sky, cloud, day, from_behind, halterneck, ocean, sideboob, solo, string_bikini, bare_arms, median_furrow, medium_breasts, green_bikini, large_breasts, standing, tree, wet, blush, teeth
12 5 1girl, bare_shoulders, blush, cleavage, cowboy_shot, detached_collar, looking_at_viewer, parted_lips, playboy_bunny, rabbit_ears, solo, strapless_leotard, thighs, alternate_costume, brown_pantyhose, covered_navel, crossed_bangs, fake_animal_ears, highleg_leotard, large_breasts, outdoors, bare_arms, black_leotard, cameltoe, forest, grin, leaf, rabbit_tail, sweat, day, detached_sleeves, hair_flower, hand_up, jewelry, long_sleeves, thigh_gap, thighlet, tree, water, wet, wrist_cuffs
搜集汇总
数据集介绍
main_image_url
构建方式
在数字艺术与角色生成领域,数据集的质量直接影响模型的输出效果。CyberHarem/collei_genshin数据集聚焦于《原神》游戏角色柯莱的视觉呈现,其构建过程体现了系统化数据采集与处理的严谨性。该数据集通过自动化爬虫系统,从Danbooru、Pixiv、Zerochan等多个知名艺术社区广泛搜集原始图像,确保来源的多样性与代表性。采集后的图像经过标准化预处理,包括尺寸调整与核心标签修剪,以去除冗余特征并统一数据格式。最终,数据集以多种规格封装,涵盖原始元数据、尺寸优化版本及多阶段裁剪变体,为不同应用场景提供灵活选择。
使用方法
该数据集适用于文本到图像生成等计算机视觉任务,其使用方式兼顾便捷性与扩展性。用户可直接通过Hugging Face Hub下载压缩包,解压后获取图像与标签文件。对于高级应用,数据集支持通过Waifuc工具加载原始数据,利用Python代码实现本地读取与元数据解析,便于集成至自定义处理流程。研究人员可根据需要选择不同版本:原始版本适合元分析;尺寸优化版本利于模型输入标准化;裁剪版本则有助于注意力机制训练。数据集的标签聚类结果还可用于视觉主题挖掘,为角色设计、风格迁移等研究提供实证基础。
背景与挑战
背景概述
在数字艺术与生成式人工智能蓬勃发展的时代,针对特定虚拟角色的高质量图像数据集成为训练文本到图像模型的关键资源。CyberHarem/collei_genshin数据集由DeepGHS团队构建,专注于《原神》游戏中的角色“柯莱”。该数据集收录了500张经过筛选与标注的图像,旨在为角色定制化图像生成提供精准的视觉-文本对齐样本。其核心价值在于通过自动化爬虫系统整合多源社区艺术创作,为角色一致性表达与风格化渲染的研究奠定了数据基础,推动了娱乐媒体领域生成模型的应用深化。
当前挑战
该数据集致力于解决虚拟角色图像生成中的细粒度属性控制与风格一致性挑战,要求模型依据复杂文本标签精确合成特定角色的多样化姿态与服饰。在构建过程中,面临多重挑战:一是多源图像的质量与标注标准不一,需通过自动化流程进行清洗与归一化;二是角色核心特征的提取与标签修剪需平衡语义完整性与数据噪声;三是部分图像涉及成人内容,对数据集的合规使用与伦理边界提出了严格考量。这些因素共同构成了数据集在可用性与泛化能力上的核心难点。
常用场景
经典使用场景
在动漫风格图像生成领域,CyberHarem/collei_genshin数据集作为特定角色视觉资料的集合,为文本到图像生成模型提供了精细化的训练素材。该数据集聚焦于《原神》角色柯莱的二次创作图像,通过精心标注的视觉特征标签,如发色、瞳色、服饰细节等,使生成模型能够学习角色的一致性外观与多样化姿态。其经典应用场景在于支持生成对抗网络或扩散模型进行风格化角色图像的合成,尤其在保持角色核心特征的同时实现姿态、背景和服饰的灵活变换,为动漫艺术创作提供了可扩展的数据基础。
解决学术问题
该数据集针对动漫角色图像生成中常见的特征一致性保持与多样化表达难题,提供了结构化的解决方案。通过整合多来源的角色图像并附有系统化的标签,它帮助研究者克服了训练数据稀缺与标注不精确的障碍,促进了生成模型在细节还原与风格迁移方面的性能提升。其意义在于推动了计算机视觉与动漫艺术交叉领域的研究,为角色特定生成任务设立了可复现的基准,并对个性化内容生成技术的演进产生了积极影响。
实际应用
在实际应用中,CyberHarem/collei_genshin数据集被广泛用于动漫游戏角色设计、同人艺术创作以及个性化内容生成平台。例如,游戏开发者可以借助该数据集训练模型,快速生成角色在不同场景下的宣传图像;数字艺术社区则利用其生成多样化的角色插图,丰富二次创作内容。此外,该数据集还支持虚拟偶像和动漫衍生品的视觉内容生产,为娱乐产业提供了高效且成本可控的创意工具。
数据集最近研究
最新研究方向
在动漫风格图像生成领域,CyberHarem/collei_genshin数据集作为针对《原神》角色柯莱的专项图像集合,正推动着角色一致性生成与细粒度属性控制的前沿探索。该数据集通过精细的标签聚类与多尺度图像裁剪,为研究者提供了探究生成模型在特定角色特征保持上的潜力,尤其是在跨姿态、服饰与场景的视觉连贯性方面。随着生成式人工智能在创意产业的应用深化,此类高质量、高标注密度的角色数据集,为个性化内容生成与风格迁移技术提供了关键的训练基础,助力于实现更精准、更多元的数字艺术创作。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作