CyberHarem/moriko_morioka_offline_netjuunosusume
收藏Hugging Face2024-03-28 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/moriko_morioka_offline_netjuunosusume
下载链接
链接失效反馈官方服务:
资源简介:
这是盛岡森子(Net-juu No Susume)的数据集,包含393张图片及其标签。该数据集的核心标签包括`purple_hair, short_hair, mole, mole_under_mouth, purple_eyes, blue_eyes`。图片来源于多个网站(如danbooru、pixiv、zerochan等),并由DeepGHS Team的自动爬取系统收集。数据集提供了多种下载选项,包括原始数据、1200像素限制的数据集以及三阶段裁剪的数据集。此外,还提供了使用waifuc加载原始数据集的代码示例,并展示了标签聚类的结果。
这是盛岡森子(Net-juu No Susume)的数据集,包含393张图片及其标签。该数据集的核心标签包括`purple_hair, short_hair, mole, mole_under_mouth, purple_eyes, blue_eyes`。图片来源于多个网站(如danbooru、pixiv、zerochan等),并由DeepGHS Team的自动爬取系统收集。数据集提供了多种下载选项,包括原始数据、1200像素限制的数据集以及三阶段裁剪的数据集。此外,还提供了使用waifuc加载原始数据集的代码示例,并展示了标签聚类的结果。
提供机构:
CyberHarem
原始信息汇总
数据集概述
数据集名称
- 名称: Moriko Morioka [Offline]/盛岡森子 (Net-juu No Susume)
数据集内容
- 内容: 包含393张图像及其标签。
- 核心标签: purple_hair, short_hair, mole, mole_under_mouth, purple_eyes, blue_eyes
数据集版本与下载
- 版本:
- raw: 393张图像,213.85 MiB
- 1200: 393张图像,213.73 MiB
- stage3-p480-1200: 702张图像,356.65 MiB
- 下载链接:
数据集使用
-
使用工具: waifuc
-
加载示例: python import os import zipfile
from huggingface_hub import hf_hub_download from waifuc.source import LocalSource
download raw archive file
zip_file = hf_hub_download( repo_id=CyberHarem/moriko_morioka_offline_netjuunosusume, repo_type=dataset, filename=dataset-raw.zip, )
extract files to your directory
dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)
load the dataset with waifuc
source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])
数据集标签集群
- 集群列表:
- 集群0: 10个样本,包含标签如1girl, anime_coloring, portrait等。
- 集群1: 17个样本,包含标签如1girl, hoodie, solo等。
- 集群2: 12个样本,包含标签如1girl, black_hair, necklace等。
- 集群3: 13个样本,包含标签如1girl, solo, black_hair等。
- 集群4: 7个样本,包含标签如1girl, blue_scrunchie, hair_scrunchie等。
- 集群5: 8个样本,包含标签如1girl, hood_down, profile等。
- 集群6: 8个样本,包含标签如1girl, blush, smile等。
- 集群7: 5个样本,包含标签如1girl, blush, sitting等。
- 集群8: 9个样本,包含标签如1girl, holding_sword, shield等。



