CyberHarem/priestess_arknights
收藏数据集概述
名称: 普瑞赛斯 (Arknights)
描述: 该数据集包含22张图像及其标签,主要描绘了游戏《Arknights》中的角色普瑞赛斯。
核心标签: long_hair, hairband, breasts, brown_hair, black_hair, black_hairband, purple_eyes, bow, hair_between_eyes, large_breasts
来源: 图像从多个网站(如danbooru, pixiv, zerochan等)自动爬取,由DeepGHS团队提供技术支持。
数据集包
| 名称 | 图像数量 | 大小 | 类型 | 描述 |
|---|---|---|---|---|
| raw | 22 | 28.41 MiB | Waifuc-Raw | 包含元信息的原始数据,最小边对齐至1400像素(如果更大)。 |
| 1200 | 22 | 24.30 MiB | IMG+TXT | 短边不超过1200像素的数据集。 |
| stage3-p480-1200 | 43 | 42.27 MiB | IMG+TXT | 三阶段裁剪数据集,区域不小于480x480像素。 |
数据集加载
提供原始数据集(包括带标签的图像)以供waifuc加载。加载代码示例:
python import os import zipfile from huggingface_hub import hf_hub_download from waifuc.source import LocalSource
下载原始存档文件
zip_file = hf_hub_download( repo_id=CyberHarem/priestess_arknights, repo_type=dataset, filename=dataset-raw.zip, )
提取文件至目录
dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)
使用waifuc加载数据集
source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])
标签聚类结果
| # | 样本数 | Img-1 | Img-2 | Img-3 | Img-4 | Img-5 | 标签 |
|---|---|---|---|---|---|---|---|
| 0 | 22 | ![]() |
![]() |
![]() |
![]() |
![]() |
1girl, solo, looking_at_viewer, smile, simple_background, long_sleeves, white_background, closed_mouth, shirt, upper_body, jacket, open_clothes |








