CyberHarem/yukinoshita_haruno_yahariorenoseishunlovecomewamachigatteiru
收藏Hugging Face2024-01-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/yukinoshita_haruno_yahariorenoseishunlovecomewamachigatteiru
下载链接
链接失效反馈官方服务:
资源简介:
这是Yukinoshita Haruno(《我的青春恋爱物语果然有问题》中的角色)的数据集,包含218张图片及其标签。数据集的核心标签包括`black_hair, short_hair, bangs, brown_eyes`,并且这些标签在数据集中被修剪。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队提供支持。数据集提供了多种格式的下载选项,包括原始数据、不同分辨率的图片以及经过裁剪的版本。此外,还提供了如何使用waifuc加载原始数据集的代码示例。最后,README文件还列出了标签聚类的结果,展示了不同标签组合的图片样本。
This is a dataset focused on Yukinoshita Haruno, a character from the light novel series *My Youth Romantic Comedy Is Wrong, As I Expected*. It contains 218 images paired with their respective tags. The core tags include `black_hair, short_hair, bangs, brown_eyes`, and these tags have been pruned within the dataset. The images were scraped from multiple platforms including danbooru, pixiv, zerochan, among others, with the crawling system powered by the DeepGHS team. The dataset provides diverse download options, such as raw data, images with varying resolutions, and cropped image versions. Moreover, code examples for loading the raw dataset via waifuc are provided. Finally, the README file lists the results of tag clustering, showcasing image samples for different tag combinations.
提供机构:
CyberHarem
原始信息汇总
数据集概述
数据集信息
- 名称: 雪之下阳乃(我的青春恋爱物语果然有问题)数据集
- 描述: 包含218张雪之下阳乃的图像及其标签。
- 核心标签:
black_hair, short_hair, bangs, brown_eyes - 来源: 从多个网站(如danbooru, pixiv, zerochan等)爬取
数据集包列表
| 名称 | 图像数量 | 大小 | 类型 | 描述 |
|---|---|---|---|---|
| raw | 218 | 109.53 MiB | Waifuc-Raw | 原始数据,包含元信息(最小边对齐到1400像素,如果更大) |
| 800 | 218 | 92.13 MiB | IMG+TXT | 短边不超过800像素的图像数据集 |
| stage3-p480-800 | 429 | 171.51 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 |
| 1200 | 218 | 109.45 MiB | IMG+TXT | 短边不超过1200像素的图像数据集 |
| stage3-p480-1200 | 429 | 197.83 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素 |
标签聚类结果
原始文本版本
| # | 样本数量 | 图像1 | 图像2 | 图像3 | 图像4 | 图像5 | 标签 |
|---|---|---|---|---|---|---|---|
| 0 | 5 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | 1boy, 1girl, jacket, school_uniform, smile, solo_focus, necktie, white_shirt, cup, doughnut, open_mouth |
| 1 | 15 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | white_shirt, 1girl, smile, collared_shirt, solo, handbag, open_clothes, cardigan, black_jacket, closed_mouth, dress_shirt, skirt, shoulder_bag, upper_body |
| 2 | 8 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | 1girl, solo, blurry_background, upper_body, anime_coloring, medium_hair, smile, closed_mouth, hair_between_eyes, looking_at_viewer, indoors, red_jacket, head_rest, portrait, white_shirt |
| 3 | 10 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | 1girl, earrings, solo, smile, bare_shoulders, blue_eyes, collarbone, off-shoulder_sweater, anime_coloring, upper_body, looking_at_viewer |
| 4 | 7 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | 1girl, open_mouth, solo, anime_coloring, smile, closed_eyes, collarbone, blush, portrait |
| 5 | 21 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | 1girl, solo, green_scarf, smile, jacket, looking_at_viewer, medium_hair, upper_body, open_mouth, indoors, ahoge, blurry, closed_mouth |
| 6 | 5 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | 1girl, close-up, hair_between_eyes, looking_at_viewer, parody, solo, long_hair, anime_coloring, blue_eyes, open_mouth |
| 7 | 5 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | jeans, necklace, sitting, smile, 1girl, 2girls, blue_eyes, bracelet, cleavage, long_hair, solo_focus, yellow_shirt |
表格版本
| # | 样本数量 | 图像1 | 图像2 | 图像3 | 图像4 | 图像5 | 1boy | 1girl | jacket | school_uniform | smile | solo_focus | necktie | white_shirt | cup | doughnut | open_mouth | collared_shirt | solo | handbag | open_clothes | cardigan | black_jacket | closed_mouth | dress_shirt | skirt | shoulder_bag | upper_body | blurry_background | anime_coloring | medium_hair | hair_between_eyes | looking_at_viewer | indoors | red_jacket | head_rest | portrait | earrings | bare_shoulders | blue_eyes | collarbone | off-shoulder_sweater | closed_eyes | blush | green_scarf | ahoge | blurry | close-up | parody | long_hair | jeans | necklace | sitting | 2girls | bracelet | cleavage | yellow_shirt |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 5 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | X | X | X | X | X | X | X | X | X | X | X | ||||||||||||||||||||||||||||||||||||||||
| 1 | 15 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | X | X | X | X | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||||||||||||||||||||||
| 2 | 8 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | ||||||||||||||||||||||||||||||||||||
| 3 | 10 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | X | X | X | X | X | X | X | X | X | X | X | ||||||||||||||||||||||||||||||||||||||||
| 4 | 7 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | X | X | X | X | X | X | X | X | X | ||||||||||||||||||||||||||||||||||||||||||
| 5 | 21 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | X | X | X | X | X | X | X | X | X | X | X | X | X | ||||||||||||||||||||||||||||||||||||||
| 6 | 5 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||||||||||||||||||||||||||
| 7 | 5 | 样本0 | 样本1 | 样本2 | 样本3 | 样本4 | X | X | X | X | X | X | X | X | X | X | X | X |
搜集汇总
数据集介绍

构建方式
在动漫角色图像数据集的构建领域,本数据集聚焦于《我的青春恋爱物语果然有问题》中的雪之下阳乃这一特定角色。其构建过程依托自动化爬虫系统,从Danbooru、Pixiv、Zerochan等多个知名动漫艺术社区系统性地采集原始图像素材,共计收集218幅图像。数据预处理阶段,对图像进行了标准化处理,确保较长边对齐至1400像素以内,并剔除了角色的核心特征标签(如黑发、短发等),以增强数据集的泛化性。此外,通过多阶段裁剪技术生成了不同分辨率版本,例如480-800像素及480-1200像素的变体,为模型训练提供了丰富的尺度适应性。
使用方法
在计算机视觉与生成式人工智能研究中,该数据集可直接应用于角色定制化图像生成任务。用户可通过Hugging Face Hub下载不同版本的数据包,其中原始数据包兼容Waifuc工具库,支持本地加载与元数据解析。研究人员可利用提供的Python代码示例,快速提取图像及对应标签信息,用于训练或微调生成模型。数据集中包含的聚类结果可辅助主题分析,例如针对特定服饰或场景进行定向生成实验。此外,多分辨率版本允许根据计算资源灵活选择输入尺度,适用于从基础生成到高清合成的多层次研究需求。
背景与挑战
背景概述
在动漫角色图像生成领域,特定角色的高质量数据集对于推动文本到图像模型的精细化生成至关重要。CyberHarem团队构建的Yukinoshita Haruno数据集,聚焦于《我的青春恋爱物语果然有问题》中的雪之下阳乃这一角色,收录了218张图像及其标注。该数据集由DeepGHS团队通过自动化爬虫系统从Danbooru、Pixiv等多个平台采集,并经过多尺度裁剪与标签聚类处理,旨在为角色一致性图像生成提供结构化数据支持。其创建体现了动漫图像数据从广泛收集向角色专属化、标签系统化的发展趋势,为二次元内容生成研究提供了细分领域的实验基础。
当前挑战
该数据集致力于解决动漫角色特定化图像生成的挑战,即如何基于文本描述精确生成符合角色设定、姿态与场景的图像。其核心难点在于保证生成图像在发型、瞳色、服饰等细节上与角色原设保持一致,同时避免风格混淆。在构建过程中,数据采集面临源平台图像质量参差、标签体系异构等问题,需通过自动化爬虫与去重技术整合多源数据。此外,原始图像尺寸与比例不一,需进行标准化裁剪与分辨率调整,以适配模型训练需求,而标签的修剪与聚类亦需平衡信息完整性与噪声过滤。
常用场景
经典使用场景
在动漫角色图像生成领域,该数据集聚焦于《我的青春恋爱物语果然有问题》中的雪之下阳乃这一特定角色,通过精心收集的218张图像及其标注,为文本到图像生成模型提供了高质量的微调素材。其经典使用场景在于训练生成对抗网络或扩散模型,以学习该角色的视觉特征,如黑色短发、棕色眼眸等核心属性,从而实现风格一致的动漫角色图像合成。
解决学术问题
该数据集针对动漫图像生成中角色一致性保持的学术难题,提供了结构化的解决方案。通过精确的角色标签和图像聚类,它助力研究者探索细粒度属性控制、跨姿态角色生成以及数据增强方法,推动了生成模型在保持角色身份稳定性方面的理论进展,为个性化内容创作奠定了算法基础。
实际应用
在实际应用中,该数据集直接服务于动漫同人创作、游戏角色设计及虚拟偶像开发等领域。创作者可利用训练后的模型高效生成阳乃角色的多样化插图,满足社交媒体内容生产、二次元周边产品设计等需求,显著降低了专业级动漫图像创作的技术门槛与时间成本。
数据集最近研究
最新研究方向
在动漫角色图像生成领域,该数据集聚焦于特定角色雪之下阳乃的视觉特征建模,为个性化角色生成提供了精细化的训练素材。当前研究热点集中于利用此类标注图像提升生成式模型的角色一致性,通过标签聚类分析挖掘服饰、姿态等语义属性,以优化文本到图像的跨模态对齐能力。随着动漫内容创作的数字化浪潮,这类数据集推动了风格化图像生成的定制化发展,对娱乐产业和数字艺术创作具有显著的实践意义。
以上内容由遇见数据集搜集并总结生成



