five

CyberHarem/kamitsure_pokemon

收藏
Hugging Face2024-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/kamitsure_pokemon
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为kamitsure/カミツレ (Pokémon)的数据集,包含500张图像及其标签。图像从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队提供支持。数据集的核心标签包括headphones, blue_eyes, breasts, blonde_hair, short_hair, bangs, blunt_bangs, black_hair, long_hair,这些标签在数据集中被修剪。README还提供了数据集的多个版本及其下载链接,并展示了如何使用waifuc加载原始数据集。此外,文件还列出了标签聚类结果,展示了不同聚类的图像样本及其标签。

This is a dataset named kamitsure/カミツレ (Pokémon), which contains 500 images paired with their respective tags. The images were crawled from multiple platforms including danbooru, pixiv, zerochan and others, with the crawling system powered by the DeepGHS team. The core tags of this dataset include headphones, blue_eyes, breasts, blonde_hair, short_hair, bangs, blunt_bangs, black_hair, long_hair, and these tags have been pruned in the dataset. The accompanying README file provides multiple versions of the dataset and their download links, and demonstrates how to use waifuc to load the raw dataset. Additionally, the README lists the tag clustering results, showing image samples of different clusters and their corresponding tags.
提供机构:
CyberHarem
原始信息汇总

数据集概述

数据集基本信息

  • 名称: Dataset of kamitsure/カミツレ (Pokémon)
  • 许可证: MIT
  • 任务类别: text-to-image
  • 标签: art, not-for-all-audiences
  • 大小类别: n<1K

数据集内容

  • 图像数量: 500
  • 核心标签: headphones, blue_eyes, breasts, blonde_hair, short_hair, bangs, blunt_bangs, black_hair, long_hair
  • 图像来源: 从多个网站爬取,如danbooru, pixiv, zerochan等

数据集包列表

名称 图像数量 大小 类型 描述
raw 500 449.94 MiB Waifuc-Raw 原始数据,包含元信息(最小边对齐到1400像素,如果更大)
800 500 298.44 MiB IMG+TXT 短边不超过800像素的图像
stage3-p480-800 1027 553.45 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素
1200 500 413.83 MiB IMG+TXT 短边不超过1200像素的图像
stage3-p480-1200 1027 721.72 MiB IMG+TXT 3阶段裁剪数据集,区域不小于480x480像素

数据集加载

  • 加载工具: waifuc
  • 加载方法: 提供Python代码示例,从Hugging Face Hub下载并解压数据集,使用waifuc加载

标签聚类结果

  • 聚类列表: 包含多个聚类结果,每个聚类包含样本数量和相关标签
  • 示例: 每个聚类提供5个样本图像和相关标签
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作