five

CyberHarem/kokoro_darlinginthefranxx

收藏
Hugging Face2024-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/kokoro_darlinginthefranxx
下载链接
链接失效反馈
官方服务:
资源简介:
这是Kokoro/ココロ (Darling in the FranXX)的数据集,包含385张图片及其标签。数据集的核心标签包括`long_hair, blue_eyes, hairband, blonde_hair, blue_hairband`,并且这些标签在数据集中被修剪。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队提供。数据集分为多个包,包括原始数据包、1200像素限制的数据包和三阶段裁剪的数据包。此外,还提供了如何使用waifuc加载原始数据集的代码示例,以及标签聚类结果的列表。

This is the dataset of Kokoro/ココロ (Darling in the FranXX), containing 385 images and their tags. The core tags of this character are long_hair, blue_eyes, hairband, blonde_hair, blue_hairband, which are pruned in this dataset. Images are crawled from many sites (e.g. danbooru, pixiv, zerochan ...), the auto-crawling system is powered by the DeepGHS Team. The dataset is available in different packages, each with varying image sizes and formats. Additionally, there is a list of clusters showing tag clustering results, which might help in mining outfits or other characteristics.
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集基本信息

  • 名称: Dataset of Kokoro/ココロ (Darling in the FranXX)
  • 许可证: MIT
  • 任务类别: text-to-image
  • 标签: art, not-for-all-audiences
  • 大小类别: n<1K
  • 图像数量: 385
  • 核心标签: long_hair, blue_eyes, hairband, blonde_hair, blue_hairband

数据集包列表

名称 图像数量 大小 类型 描述
raw 385 260.77 MiB Waifuc-Raw 原始数据,包含元信息(最小边对齐到1400像素,如果更大)
1200 385 260.66 MiB IMG+TXT 短边不超过1200像素的数据集
stage3-p480-1200 701 431.52 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素

标签聚类结果

原始文本版本

# 样本数量 图像1 图像2 图像3 图像4 图像5 标签
0 17 1girl, solo, parody, uniform, looking_at_viewer, open_mouth, long_sleeves
1 13 1girl, portrait, solo, anime_coloring, closed_mouth, parody, close-up
2 8 2girls, uniform, 1girl, open_mouth
3 7 1boy, 1girl, blush, brown_hair, parody, looking_at_another
4 8 long_sleeves, 1girl, school_uniform, solo_focus, indoors, multiple_girls, smile, socks
5 5 1girl, closed_mouth, from_side, profile, upper_body, black_hairband, black_jacket, blurry_background, brown_hair, solo
6 11 1girl, beach, green_bikini, open_mouth, outdoors, solo, frilled_bikini, navel, ocean, water, cleavage, :d, bracelet, medium_breasts
7 5 1girl, solo, brown_hair, partially_submerged, upper_body, water, bathing, closed_mouth, medium_breasts, outdoors, tree, wavy_hair, blush, cleavage, closed_eyes, completely_nude, forest, smile, wet_hair
8 5 1girl, bed, open_mouth, pillow, blanket, solo, collarbone, hair_over_shoulder, single_braid, closed_eyes, grey_hair, sweatdrop
9 21 bridal_veil, 1girl, wedding_dress, white_dress, bare_shoulders, flower, cleavage, open_mouth, strapless, smile

表格版本

# 样本数量 图像1 图像2 图像3 图像4 图像5 1girl solo parody uniform looking_at_viewer open_mouth long_sleeves portrait anime_coloring closed_mouth close-up 2girls 1boy blush brown_hair looking_at_another school_uniform solo_focus indoors multiple_girls smile socks from_side profile upper_body black_hairband black_jacket blurry_background beach green_bikini outdoors frilled_bikini navel ocean water cleavage :d bracelet medium_breasts partially_submerged bathing tree wavy_hair closed_eyes completely_nude forest wet_hair bed pillow blanket collarbone hair_over_shoulder single_braid grey_hair sweatdrop bridal_veil wedding_dress white_dress bare_shoulders flower strapless
0 17 X X X X X X X
1 13 X X X X X X X
2 8 X X X X
3 7 X X X X X X
4 8 X X X X X X X X
5 5 X X X X X X X X X X
6 11 X X X X X X X X X X X X X X
7 5 X X X X X X X X X X X X X X X X X X X
8 5 X X X X X X X X X X X X
9 21 ![](samples
搜集汇总
数据集介绍
main_image_url
构建方式
在动漫角色图像数据集的构建领域,CyberHarem/kokoro_darlinginthefranxx数据集通过自动化爬虫系统,从Danbooru、Pixiv、Zerochan等多个知名动漫艺术社区系统性地采集了385张以《DARLING in the FRANXX》中角色“Kokoro”为主题的图像。原始数据经过预处理,包括核心标签的修剪与图像尺寸的标准化,确保最小边缘对齐至1400像素,为后续的模型训练提供了结构化的高质量素材。
特点
该数据集在动漫角色图像数据集中展现出鲜明的特色,其图像均附有精细的标签标注,涵盖了角色属性、场景、服饰及动作等多维度描述。数据集提供了三种不同处理版本:原始数据包、短边不超过1200像素的版本以及经过三阶段裁剪的增强版本,满足不同分辨率与训练阶段的需求。此外,数据集还包含了基于标签的聚类分析结果,直观揭示了角色在不同装扮与场景下的视觉模式。
使用方法
针对文本生成图像的研究与应用,本数据集支持多种加载方式。用户可直接下载ZIP压缩包获取图像与对应标签文本文件。对于需要利用元信息进行高级处理的场景,推荐通过Waifuc工具库加载原始数据包,该方式能完整保留图像的标签元数据。研究人员可根据训练需求选择不同版本的数据集,并参考提供的聚类表格,深入分析角色视觉特征的分布规律,以优化模型对特定角色属性的生成效果。
背景与挑战
背景概述
在动漫角色图像生成与风格化研究领域,特定角色的高质量图像数据集对于推动文本到图像生成模型的精细化发展具有关键意义。CyberHarem/kokoro_darlinginthefranxx数据集由DeepGHS团队构建,专注于《DARLING in the FRANXX》中的角色Kokoro(ココロ),收录了385张图像及其标注标签。该数据集通过自动化爬虫系统从Danbooru、Pixiv、Zerochan等多个知名二次元艺术平台采集,核心标签经过精心筛选与修剪,旨在为角色一致性图像生成、标签语义理解及动漫风格迁移等研究任务提供结构化数据支持。其构建体现了对动漫角色视觉特征系统化整理的学术追求,为相关领域的模型训练与评估奠定了数据基础。
当前挑战
该数据集致力于解决动漫角色特定化图像生成中的挑战,即如何在保持角色核心视觉特征(如长发、蓝眼、发带等)一致性的前提下,生成多样化姿态、场景与服饰的高质量图像。构建过程中面临多重挑战:一是数据源的异构性,来自不同平台的图像在分辨率、艺术风格及标注规范上存在显著差异,需进行复杂的清洗与标准化处理;二是标签体系的精细化需求,需在去除冗余核心标签的同时保留足够丰富的语义信息以支持细粒度生成任务;三是数据规模有限,仅385张图像可能不足以覆盖角色全貌,对模型的泛化能力构成考验。
常用场景
经典使用场景
在动漫角色图像生成领域,该数据集作为特定角色“Kokoro”的视觉资料库,为文本到图像生成模型提供了精准的训练素材。其经典应用场景集中于动漫风格图像的合成与风格迁移研究,通过高分辨率图像与精细标注的标签对,支持生成对抗网络(GAN)和扩散模型学习角色特征与艺术风格的映射关系。数据集中的多场景图像涵盖了从日常着装到特殊服饰的视觉表现,为模型理解角色在不同语境下的视觉呈现提供了丰富样本。
解决学术问题
该数据集针对动漫图像生成中角色一致性保持与细粒度属性控制的学术难题提供了解决方案。通过提供同一角色在多场景下的标注图像,它助力研究者探索生成模型对发型、瞳色、服饰等稳定特征的捕捉能力,并推动标签条件生成中语义对齐精度的提升。其意义在于为二次元角色生成建立了可量化的评估基准,影响了生成式人工智能在风格化内容创作领域的算法优化方向。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在动漫风格生成模型的微调与优化领域。例如,基于稳定扩散(Stable Diffusion)架构的角色定制化模型训练常以此类高质量标注数据集作为关键输入,以提升生成图像的细节保真度。同时,该数据集也促进了标签聚类分析与视觉属性解耦的研究,为理解图像标签与视觉特征之间的关联提供了实证分析案例,进而推动了条件生成模型在动漫领域的适应性改进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作