CyberHarem/waai_fu_arknights
收藏Hugging Face2024-03-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/waai_fu_arknights
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为waai_fu/ワイフー/槐琥 (Arknights),包含500张图片及其标签。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队提供支持。数据集的核心标签包括动物耳朵、多色头发、毛茸茸的女性、虎耳、虎女、短发、橙发、白发、橙眼、尾巴、虎尾、黑发、胸部、圆眼镜、有色眼镜、眼镜、橙色调眼镜、大胸部、眼睛间的头发等。数据集提供了多个版本的下载链接,包括原始数据、1200像素版本和三阶段裁剪版本。此外,还提供了如何使用waifuc加载原始数据集的代码示例。
该数据集名为waai_fu/ワイフー/槐琥 (Arknights),包含500张图片及其标签。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队提供支持。数据集的核心标签包括动物耳朵、多色头发、毛茸茸的女性、虎耳、虎女、短发、橙发、白发、橙眼、尾巴、虎尾、黑发、胸部、圆眼镜、有色眼镜、眼镜、橙色调眼镜、大胸部、眼睛间的头发等。数据集提供了多个版本的下载链接,包括原始数据、1200像素版本和三阶段裁剪版本。此外,还提供了如何使用waifuc加载原始数据集的代码示例。
提供机构:
CyberHarem
原始信息汇总
数据集概述:waai_fu/ワイフー/槐琥 (Arknights)
数据集基本信息
- 许可证: MIT
- 任务类别: 文本到图像
- 标签: 艺术, 不适用于所有观众
- 大小类别: 小于1K
数据集内容
- 包含内容: 500张图像及其标签
- 核心标签: animal_ears, multicolored_hair, furry_female, tiger_ears, tiger_girl, short_hair, orange_hair, white_hair, orange_eyes, tail, tiger_tail, black_hair, breasts, round_eyewear, tinted_eyewear, glasses, orange-tinted_eyewear, large_breasts, hair_between_eyes
数据集包列表
| 名称 | 图像数量 | 大小 | 下载链接 | 类型 | 描述 |
|---|---|---|---|---|---|
| raw | 500 | 719.36 MiB | 下载 | Waifuc-Raw | 包含元信息的原始数据(如果较大则最小边对齐到1400)。 |
| 1200 | 500 | 605.22 MiB | 下载 | IMG+TXT | 短边不超过1200像素的数据集。 |
| stage3-p480-1200 | 1228 | 1.15 GiB | 下载 | IMG+TXT | 三阶段裁剪数据集,区域不小于480x480像素。 |
数据集使用
- 加载方式: 使用waifuc加载原始数据集。
- 示例代码: 提供Python代码用于下载和提取数据集,并使用waifuc加载。
数据集集群列表
- 集群信息: 列出标签聚类结果,可能包含可挖掘的服装信息。
- 集群示例: 提供每个集群的样本图像及其标签,用于展示数据集的多样性和特定主题。
集群列表示例
| 集群编号 | 样本数量 | 图像示例 | 标签示例 |
|---|---|---|---|
| 0 | 7 | 示例图像 | 1girl, closed_mouth, furry, multicolored_fur, orange_fur, simple_background, solo, body_fur, sunglasses, white_capelet, white_fur, animal_nose, black_nails, looking_at_viewer, black_dress, upper_body, white_background, chinese_clothes, cowboy_shot |
| 1 | 12 | 示例图像 | 1girl, furry, multicolored_fur, solo, white_fur, full_body, orange_fur, simple_background, white_capelet, looking_at_viewer, white_background, black_footwear, standing_on_one_leg, white_pants, sunglasses |
| 2 | 14 | 示例图像 | 1girl, china_dress, furry, looking_at_viewer, red_dress, solo, black_gloves, multicolored_fur, body_fur, closed_mouth, simple_background, cowboy_shot, elbow_gloves, white_background, white_fur, cleavage, orange_fur, smile, animal_nose, bare_shoulders, standing |
| 3 | 6 | 示例图像 | 1girl, furry, holding_knife, holding_weapon, multicolored_fur, solo, gloves, looking_at_viewer, orange_fur, sunglasses, white_capelet, white_fur |
| 4 | 6 | 示例图像 | 1girl, animal_nose, body_fur, cleavage, closed_mouth, furry, looking_at_viewer, multicolored_fur, simple_background, smile, solo, white_background, orange_fur, sitting, bikini, navel, white_fur, brown_hair |
| 5 | 7 | 示例图像 | 1girl, abs, black_sports_bra, furry, muscular_female, solo, navel, simple_background, smile, white_background, body_fur, cleavage, closed_mouth, looking_at_viewer, black_shorts, cowboy_shot, hand_on_own_hip, midriff, wristband, brown_hair, pants |
| 6 | 7 | 示例图像 | 1girl, abs, furry, looking_at_viewer, muscular_female, navel, simple_background, solo, white_background, black_bikini, body_fur, cleavage, full_body, open_mouth, smile, standing, one_eye_closed, orange_fur, speech_bubble, spoken_heart, white_fur, brown_hair, hand_on_own_hip |
| 7 | 14 | 示例图像 | furry_male, single_horn, male_focus, streaked_hair, open_mouth, white_fur, 1boy, dog_boy, smile, brown_fur, dog_ears, medium_hair, two-tone_fur, 2boys, holding, looking_at_viewer, sleeveless_shirt, black_shirt, food |
| 8 | 7 | 示例图像 | 1boy, male_focus, furry_male, looking_at_viewer, solo_focus, jewelry, cat_boy, jacket, yellow_eyes, black_pants, colored_sclera, gloves, hair_over_one_eye, holding, shirt, sitting, slit_pupils |
搜集汇总
数据集介绍

构建方式
在数字艺术与动漫角色生成领域,数据集的构建需兼顾内容的丰富性与标注的精确性。本数据集围绕《明日方舟》中的角色槐琥(waai_fu)展开,通过自动化爬虫系统从Danbooru、Pixiv、Zerochan等多个知名艺术平台系统性地采集了500幅图像。每幅图像均附有经过修剪的元标签,这些标签提炼了角色的核心视觉特征,如动物耳朵、多色毛发等,确保了数据在语义层面的结构化。原始图像在采集时已进行尺寸标准化处理,最小边缘对齐至1400像素,为后续的模型训练提供了高质量的视觉素材基础。
特点
该数据集在动漫风格图像生成任务中展现出鲜明的专一性与深度。其核心在于聚焦单一角色槐琥,通过精细的标签体系刻画了角色的多样化视觉属性,涵盖发型、服饰、姿态等细节。数据集提供了三种不同预处理版本:原始数据保留完整元信息;尺寸优化版本将短边限制在1200像素内;三阶段裁剪版本则确保图像区域不低于480x480像素,兼顾了训练效率与内容完整性。此外,数据集附带的聚类分析结果揭示了角色在不同服装与场景下的视觉模式,为风格化生成研究提供了可解释的结构洞察。
使用方法
为支持文本到图像生成模型的训练与评估,本数据集提供了多层次的访问方式。研究者可通过Hugging Face Hub直接下载预处理后的图像-文本对压缩包,并集成至常见深度学习框架中。对于需要原始元数据的进阶应用,可利用配套的Waifuc工具库加载本地解压后的数据,从而访问每幅图像的完整标签序列。数据集的聚类表格进一步辅助用户依据视觉主题筛选样本,例如针对特定服饰或构图进行定向训练。这种灵活的数据接入设计,兼顾了从快速实验到细致分析的不同研究场景需求。
背景与挑战
背景概述
在数字艺术与生成式人工智能蓬勃发展的背景下,针对特定风格角色的高质量图像数据需求日益凸显。CyberHarem/waai_fu_arknights数据集由DeepGHS团队构建,专注于手机游戏《明日方舟》中的角色“槐琥”(waai_fu)。该数据集收录了约500幅从Danbooru、Pixiv等主流艺术社区爬取的图像,并附有精细的标签标注。其核心研究问题在于为文本到图像生成模型提供高度结构化、角色特征明确的训练数据,以支持动漫风格角色、特别是兽耳娘(furry)等亚文化主题的精准生成。这类数据集的涌现,显著推动了角色一致性生成、属性可控合成等细分方向的技术探索。
当前挑战
该数据集致力于解决动漫风格角色图像生成中角色特征保持与属性精细化控制的挑战。具体而言,模型需准确理解并组合如“兽耳”、“异色毛发”、“特定服饰”等复杂视觉属性,以生成符合角色设定的图像。在构建过程中,挑战主要源于数据收集与处理环节:从多源平台爬取图像需处理版权与内容审核的差异;自动化标注系统在应对“兽耳娘”等混合生物特征时,标签的准确性与一致性难以保证;此外,原始图像在构图、画风及分辨率上存在显著差异,进行标准化裁剪与尺寸归一化以构建适用于模型训练的高质量数据,亦是一项繁复的工程任务。
常用场景
经典使用场景
在数字艺术与生成式人工智能的交叉领域,CyberHarem/waai_fu_arknights数据集以其精细标注的二次元角色图像,为文本到图像的生成模型提供了高质量的微调素材。该数据集聚焦于手游《明日方舟》中的槐琥角色,涵盖了多样化的视觉特征与姿态,使得研究者能够针对特定风格或角色进行定向训练,从而在保持角色一致性的同时探索艺术风格的多样性。
解决学术问题
该数据集有效应对了生成式模型中角色一致性保持与细粒度属性控制的学术挑战。通过提供高精度标签与聚类分析,它支持了跨模态表示学习、条件图像生成等研究方向,尤其在解决生成内容与文本描述对齐、减少模型偏差方面具有显著意义。其结构化标注体系为量化评估生成质量提供了可靠基准,推动了可控生成技术的理论进展。
衍生相关工作
围绕该数据集,已衍生出多项聚焦于二次元角色生成的经典研究,例如基于标签聚类的风格化图像合成、跨平台角色一致性保持模型,以及针对Furry艺术特征的生成对抗网络优化。这些工作不仅深化了特定领域的生成技术,还为开源社区贡献了可复现的微调流程与评估框架,促进了学术与产业应用的协同发展。
以上内容由遇见数据集搜集并总结生成



