CyberHarem/pachira_pokemon
收藏Hugging Face2024-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CyberHarem/pachira_pokemon
下载链接
链接失效反馈官方服务:
资源简介:
这是一个名为pachira/パキラ (Pokémon)的数据集,包含107张图片及其标签。图片从多个网站(如danbooru、pixiv、zerochan等)爬取,爬取系统由DeepGHS团队开发。数据集的核心标签包括`pink_hair, long_hair, breasts, sunglasses, tinted_eyewear, red-tinted_eyewear, sidelocks, glasses`,这些标签在数据集中被修剪。README还提供了数据集的多个版本及其下载链接,以及如何使用waifuc加载原始数据集的示例代码。此外,README还列出了标签聚类结果,展示了不同聚类的图片和标签。
This is a dataset named pachira/パキラ (Pokémon) containing 107 images and their corresponding labels. All images were crawled from multiple platforms including danbooru, pixiv, zerochan and others, with the crawling system developed by the DeepGHS team. The core tags of the dataset include `pink_hair, long_hair, breasts, sunglasses, tinted_eyewear, red-tinted_eyewear, sidelocks, glasses`, and these tags have been pruned in the dataset. The README also provides multiple versions of the dataset along with their download links, as well as sample code for loading the original dataset using waifuc. In addition, the README also lists the tag clustering results, showing the images and tags of each cluster.
提供机构:
CyberHarem
原始信息汇总
数据集概述
数据集信息
- 名称: Dataset of pachira/パキラ (Pokémon)
- 描述: 包含107张图片及其标签的数据集。
- 核心标签:
pink_hair, long_hair, breasts, sunglasses, tinted_eyewear, red-tinted_eyewear, sidelocks, glasses - 标签分类: 数据集中的图片标签经过分类处理。
数据集包列表
| 名称 | 图片数量 | 大小 | 类型 | 描述 |
|---|---|---|---|---|
| raw | 107 | 79.53 MiB | Waifuc-Raw | 原始数据,包含元信息(最小边对齐到1400像素,如果更大)。 |
| 800 | 107 | 55.74 MiB | IMG+TXT | 短边不超过800像素的数据集。 |
| stage3-p480-800 | 217 | 99.74 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素。 |
| 1200 | 107 | 74.56 MiB | IMG+TXT | 短边不超过1200像素的数据集。 |
| stage3-p480-1200 | 217 | 124.21 MiB | IMG+TXT | 3阶段裁剪数据集,区域不小于480x480像素。 |
标签集群列表
原始文本版本
| # | 样本数量 | 图片示例 | 标签 |
|---|---|---|---|
| 0 | 8 | ![]() |
1girl, black_shirt, crop_top, midriff, sleeveless_shirt, solo, bare_arms, navel, eyelashes, looking_at_viewer, smile, bangs, orange-tinted_eyewear, red_pants, simple_background, closed_mouth, white_background, hand_up, holding, orange_eyes, shiny, upper_body |
| 1 | 5 | ![]() |
1girl, crop_top, midriff, sleeveless, smile, solo, navel, pants, lipstick, nail_polish, turtleneck |
| 2 | 10 | ![]() |
1girl, hetero, 1boy, penis, blush, nipples, nude, solo_focus, uncensored, cum_in_pussy, eyelashes, large_breasts, navel, testicles, fellatio, pubic_hair, sex, spread_legs |
| 3 | 5 | ![]() |
1girl, all_fours, bestiality, doggystyle, hetero, pokemon_(creature), pokephilia, sex_from_behind, cum, tongue, eyelashes, large_breasts, nipples, nude, red_eyes, sweat, bottomless, bouncing_breasts, clenched_teeth, half-closed_eyes, open_mouth, rolling_eyes |
表格版本
| # | 样本数量 | 图片示例 | 1girl | black_shirt | crop_top | midriff | sleeveless_shirt | solo | bare_arms | navel | eyelashes | looking_at_viewer | smile | bangs | orange-tinted_eyewear | red_pants | simple_background | closed_mouth | white_background | hand_up | holding | orange_eyes | shiny | upper_body | sleeveless | pants | lipstick | nail_polish | turtleneck | hetero | 1boy | penis | blush | nipples | nude | solo_focus | uncensored | cum_in_pussy | large_breasts | testicles | fellatio | pubic_hair | sex | spread_legs | all_fours | bestiality | doggystyle | pokemon_(creature) | pokephilia | sex_from_behind | cum | tongue | red_eyes | sweat | bottomless | bouncing_breasts | clenched_teeth | half-closed_eyes | open_mouth | rolling_eyes |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 8 | ![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | ||||||||||||||||||||||||||||||||||||
| 1 | 5 | ![]() |
X | X | X | X | X | X | X | X | X | X | X | |||||||||||||||||||||||||||||||||||||||||||||||
| 2 | 10 | ![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | ||||||||||||||||||||||||||||||||||||||||
| 3 | 5 | ![]() |
X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X | X |
搜集汇总
数据集介绍

构建方式
本数据集为CyberHarem/pachira_pokemon,包含107张与宝可梦角色帕琪拉相关的图像及其标签。图像主要从danbooru、pixiv、zerochan等网站爬取,并使用DeepGHS团队的自动爬取系统进行采集。数据集核心标签包括粉红色头发、长头发、胸部、太阳镜、有色眼镜、红边眼镜、侧辫和眼镜等,均经过筛选处理。
使用方法
使用该数据集时,用户可以根据自己的需求选择合适的下载格式。以使用原始数据为例,用户可以运行提供的Python代码,将数据集下载并解压缩到指定目录,然后使用waifuc库加载图像及其标签。此外,数据集还提供了标签聚类结果,方便用户挖掘相关数据。
背景与挑战
背景概述
在当代数字艺术与人工智能相结合的背景下,CyberHarem团队推出了一项名为'pachira_pokemon'的数据集。该数据集包含107张与'pachira'(帕奇拉,一种虚构角色)相关的图像及其标签。该角色以其粉色头发、长头发、胸部、太阳镜、有色眼镜、红边眼镜、侧辫和眼镜等特征而闻名。图像主要来源于danbooru、pixiv、zerochan等网站,自动爬取系统由DeepGHS团队提供。数据集以不同分辨率和格式提供,以适应不同研究需求。此外,还提供了标签聚类结果,以供进一步挖掘和研究。
当前挑战
该数据集面临的挑战包括:1) 图像内容可能不适合所有受众,涉及成人内容;2) 数据集规模较小,可能限制了其在深度学习模型训练中的应用;3) 图像质量可能不统一,需要进一步处理以提高数据集的可用性;4) 数据集的标签可能存在不一致性,需要进行清洗和标准化处理。
常用场景
经典使用场景
在文本到图像的生成任务中,该数据集被广泛用于训练和测试模型。通过提供丰富的图像和标签,该数据集为模型提供了充足的视觉和语义信息,有助于提高模型在图像生成任务中的表现。同时,该数据集也适用于图像分类、目标检测等计算机视觉任务。
解决学术问题
该数据集解决了文本到图像生成任务中数据集规模小、多样性不足的问题。通过收集大量的图像和标签,该数据集提供了更全面、更丰富的视觉和语义信息,有助于提高模型在图像生成任务中的表现。此外,该数据集还提供了标签聚类结果,有助于研究者在特定主题或风格上进行更深入的研究。
实际应用
该数据集在实际应用中具有广泛的应用前景。例如,在游戏、动画、虚拟现实等领域,该数据集可以用于生成具有丰富细节和表现力的图像,提升用户体验。同时,该数据集也可以用于设计、广告等领域,帮助设计师和广告商快速生成具有创意的图像。
数据集最近研究
最新研究方向
在计算机视觉与生成模型研究领域,CyberHarem/pachira_pokemon数据集以其特定的角色形象和丰富的视觉特征,成为文本到图像合成任务中的一个重要资源。近期研究主要聚焦于如何利用该数据集优化生成模型的细节表现力,特别是在角色特征、场景构建以及图像质量上的提升。此外,该数据集在艺术创作与动漫文化研究中的应用亦受到关注,其影响和意义在于为相关领域提供了实验基础,推动了虚拟角色形象在数字媒体艺术中的深度应用。
以上内容由遇见数据集搜集并总结生成







