CyberHarem/micro_uzi_girlsfrontline
收藏Hugging Face2024-01-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/micro_uzi_girlsfrontline
下载链接
链接失效反馈官方服务:
资源简介:
这是名为micro_uzi/MicroUzi/微型乌兹 (Girls Frontline)的数据集,包含84张图片及其标签。核心标签包括长头发、双马尾、绿发、胸部、绿眼睛、刘海、大胸部、非常长的头发和帽子。图片从多个网站爬取,如danbooru、pixiv、zerochan等,爬取系统由DeepGHS团队提供。数据集提供了多种格式和尺寸的下载选项,包括原始数据、800像素、1200像素等不同尺寸的图片。此外,还提供了使用waifuc加载原始数据集的代码示例,以及标签聚类结果的列表。
这是名为micro_uzi/MicroUzi/微型乌兹 (Girls Frontline)的数据集,包含84张图片及其标签。核心标签包括长头发、双马尾、绿发、胸部、绿眼睛、刘海、大胸部、非常长的头发和帽子。图片从多个网站爬取,如danbooru、pixiv、zerochan等,爬取系统由DeepGHS团队提供。数据集提供了多种格式和尺寸的下载选项,包括原始数据、800像素、1200像素等不同尺寸的图片。此外,还提供了使用waifuc加载原始数据集的代码示例,以及标签聚类结果的列表。
提供机构:
CyberHarem
原始信息汇总
数据集概述:micro_uzi/MicroUzi/微型乌兹 (Girls Frontline)
数据集基本信息
- 许可证: MIT
- 任务类别: text-to-image
- 标签: art, not-for-all-audiences
- 大小类别: n<1K
数据集内容
- 包含内容: 84张图像及其标签
- 核心标签: long_hair, twintails, green_hair, breasts, green_eyes, bangs, large_breasts, very_long_hair, hat
数据集来源
- 图像来源: 多个网站(如danbooru, pixiv, zerochan等)
- 自动爬虫系统: DeepGHS Team
数据集包列表
| 名称 | 图像数量 | 大小 | 类型 | 描述 |
|---|---|---|---|---|
| raw | 84 | 78.41 MiB | Waifuc-Raw | 原始数据,包含元信息(最小边对齐到1400像素,如果更大) |
| 800 | 84 | 45.24 MiB | IMG+TXT | 短边不超过800像素的图像数据集 |
| stage3-p480-800 | 180 | 93.93 MiB | IMG+TXT | 三阶段裁剪数据集,区域不小于480x480像素 |
| 1200 | 84 | 68.84 MiB | IMG+TXT | 短边不超过1200像素的图像数据集 |
| stage3-p480-1200 | 180 | 133.93 MiB | IMG+TXT | 三阶段裁剪数据集,区域不小于480x480像素 |
数据集加载
- 加载工具: waifuc
- 加载方法: 使用提供的Python代码从Hugging Face Hub下载并解压数据集,然后通过waifuc加载。
数据集标签聚类结果
- 聚类列表: 包含多个聚类,每个聚类展示5张样本图像及其共同标签。
- 示例聚类:
- 聚类0: 14个样本,包含标签如1girl, solo, navel, black_gloves等。
- 聚类1: 8个样本,包含标签如1girl, solo, simple_background, white_background等。
- 聚类2: 8个样本,包含标签如1boy, 1girl, hetero, sweat等。



