CyberHarem/takani_megumi_rurounikenshin2023
收藏Hugging Face2024-05-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/takani_megumi_rurounikenshin2023
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是关于《浪客剑心(2023)》中的角色高荷恵(Takani Megumi)的图像数据集,包含352张图像及其标签。图像从多个网站(如danbooru、pixiv、zerochan等)爬取,核心标签包括`black_hair, long_hair, purple_eyes`。数据集提供了原始数据和经过裁剪处理的数据包,并提供了如何使用waifuc工具加载原始数据集的代码示例。此外,还列出了标签聚类结果,展示了不同标签组合下的图像样本。
该数据集是关于《浪客剑心(2023)》中的角色高荷恵(Takani Megumi)的图像数据集,包含352张图像及其标签。图像从多个网站(如danbooru、pixiv、zerochan等)爬取,核心标签包括`black_hair, long_hair, purple_eyes`。数据集提供了原始数据和经过裁剪处理的数据包,并提供了如何使用waifuc工具加载原始数据集的代码示例。此外,还列出了标签聚类结果,展示了不同标签组合下的图像样本。
提供机构:
CyberHarem
原始信息汇总
数据集概述:Takani Megumi/高荷恵 (Rurouni Kenshin (2023))
数据集基本信息
- 许可证: MIT
- 任务类别: 文本到图像
- 标签: 艺术, 不适用于所有观众
- 大小类别: 小于1K
数据集内容
- 包含内容: 352张图像及其标签
- 核心标签:
black_hair, long_hair, purple_eyes
数据集来源
- 图像来源: 多个网站,如danbooru, pixiv, zerochan等
- 自动爬虫系统: DeepGHS Team (huggingface organization)
数据集包
原始数据包
- 名称: raw
- 图像数量: 352
- 大小: 274.89 MiB
- 下载链接: Download
- 类型: Waifuc-Raw
- 描述: 包含元信息的原始数据(最小边对齐到1400像素,如果更大)
处理后数据包
- 名称: stage3-p480-1200
- 图像数量: 635
- 大小: 459.74 MiB
- 下载链接: Download
- 类型: IMG+TXT
- 描述: 三阶段裁剪数据集,区域不小于480x480像素
数据集加载
-
加载工具: waifuc
-
加载代码示例: python import os import zipfile
from huggingface_hub import hf_hub_download from waifuc.source import LocalSource
下载原始档案文件
zip_file = hf_hub_download( repo_id=CyberHarem/takani_megumi_rurounikenshin2023, repo_type=dataset, filename=dataset-raw.zip, )
提取文件到目录
dataset_dir = dataset_dir os.makedirs(dataset_dir, exist_ok=True) with zipfile.ZipFile(zip_file, r) as zf: zf.extractall(dataset_dir)
使用waifuc加载数据集
source = LocalSource(dataset_dir) for item in source: print(item.image, item.meta[filename], item.meta[tags])
数据集集群列表
- 集群列表: 包含多个集群,每个集群有不同的样本数量和特征标签,如1girl, kimono, solo等。
- 示例集群:
- 集群0: 6个样本,特征包括1girl, holding, kimono, solo等。
- 集群1: 10个样本,特征包括1girl, looking_at_viewer, solo等。
- 集群2: 11个样本,特征包括1girl, portrait, solo等。
- 集群3: 5个样本,特征包括1girl, closed_mouth, solo等。
- 集群4: 5个样本,特征包括1girl, anime_coloring, blue_eyes等。
- 集群5: 5个样本,特征包括1girl, anime_coloring, obi等。
- 集群6: 5个样本,特征包括1girl, blue_eyes, bob_cut等。
- 集群7: 9个样本,特征包括1girl, kimono, solo_focus等。
- 集群8: 5个样本,特征包括1girl, closed_mouth, kimono等。
- 集群9: 8个样本,特征包括1girl, indoors, kimono等。
- 集群10: 5个样本,特征包括1girl, kimono, katana等。
- 集群11: 11个样本,特征包括kimono, 1boy, 1girl等。
- 集群12: 5个样本,特征包括1boy, 1girl, close-up等。



