five

CyberHarem/hanazuki_azurlane|图像识别数据集|动漫角色数据集

收藏
hugging_face2024-01-13 更新2024-03-04 收录
图像识别
动漫角色
下载链接:
https://hf-mirror.com/datasets/CyberHarem/hanazuki_azurlane
下载链接
链接失效反馈
资源简介:
这是hanazuki/花月/花月 (Azur Lane)的数据集,包含127张图片及其标签。核心标签包括`pink_hair, animal_ears, long_hair, green_eyes, fox_ears, hair_ornament, hairband, fox_girl, hair_flower, breasts, tail, fox_tail, bangs, animal_ear_fluff, hair_between_eyes`。图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬取系统由DeepGHS团队提供。数据集提供了多种格式的下载链接,包括原始数据、不同分辨率的图片以及经过裁剪的图片。此外,还提供了使用waifuc加载原始数据集的代码示例,并展示了标签聚类结果。

这是hanazuki/花月/花月 (Azur Lane)的数据集,包含127张图片及其标签。核心标签包括`pink_hair, animal_ears, long_hair, green_eyes, fox_ears, hair_ornament, hairband, fox_girl, hair_flower, breasts, tail, fox_tail, bangs, animal_ear_fluff, hair_between_eyes`。图片从多个网站(如danbooru, pixiv, zerochan等)爬取,爬取系统由DeepGHS团队提供。数据集提供了多种格式的下载链接,包括原始数据、不同分辨率的图片以及经过裁剪的图片。此外,还提供了使用waifuc加载原始数据集的代码示例,并展示了标签聚类结果。
提供机构:
CyberHarem
原始信息汇总

数据集概述:hanazuki/花月/花月 (Azur Lane)

数据集基本信息

  • 许可证:MIT
  • 任务类别:text-to-image
  • 标签:art, not-for-all-audiences
  • 大小类别:n<1K

数据集内容

  • 包含内容:127张图像及其标签。
  • 核心标签:pink_hair, animal_ears, long_hair, green_eyes, fox_ears, hair_ornament, hairband, fox_girl, hair_flower, breasts, tail, fox_tail, bangs, animal_ear_fluff, hair_between_eyes。

数据集下载

数据集包列表

名称 图像数量 大小 下载链接 类型 描述
raw 127 220.86 MiB 下载 Waifuc-Raw Raw data with meta information (min edge aligned to 1400 if larger).
800 127 117.94 MiB 下载 IMG+TXT dataset with the shorter side not exceeding 800 pixels.
stage3-p480-800 327 260.20 MiB 下载 IMG+TXT 3-stage cropped dataset with the area not less than 480x480 pixels.
1200 127 191.87 MiB 下载 IMG+TXT dataset with the shorter side not exceeding 1200 pixels.
stage3-p480-1200 327 382.71 MiB 下载 IMG+TXT 3-stage cropped dataset with the area not less than 480x480 pixels.

数据集加载

  • 加载工具waifuc
  • 加载方法:提供了一段Python代码,用于下载和加载原始数据集。

数据集集群信息

集群列表

原始文本版本

# 样本数 图像示例 标签
0 6 1girl, bare_shoulders, black_gloves, detached_sleeves, flower, looking_at_viewer, oil-paper_umbrella, solo, blush, cherry_blossoms, holding_umbrella, smile, white_kimono, open_mouth
1 15 1girl, bare_shoulders, black_gloves, looking_at_viewer, solo, blush, detached_sleeves, flower, oil-paper_umbrella, smile, white_kimono, wide_sleeves, holding_umbrella, obi, cherry_blossoms, closed_mouth, long_sleeves, sleeveless_kimono, no_panties, very_long_hair, groin, petals, sideboob
2 15 1girl, bare_shoulders, flower, looking_at_viewer, solo, official_alternate_costume, china_dress, clothing_cutout, pelvic_curtain, cleavage, white_dress, red_gloves, sleeveless_dress, white_thighhighs, feather_boa, pink_gloves, holding, medium_breasts, open_mouth, pink_hairband, gold_trim, simple_background, sitting, smile, very_long_hair, white_background

表格版本

# 样本数 图像示例 1girl bare_shoulders black_gloves detached_sleeves flower looking_at_viewer oil-paper_umbrella solo blush cherry_blossoms holding_umbrella smile white_kimono open_mouth wide_sleeves obi closed_mouth long_sleeves sleeveless_kimono no_panties very_long_hair groin petals sideboob official_alternate_costume china_dress clothing_cutout pelvic_curtain cleavage white_dress red_gloves sleeveless_dress white_thighhighs feather_boa pink_gloves holding medium_breasts pink_hairband gold_trim simple_background sitting white_background
0 6 X X X X X X X X X X X X X X
1 15 X X X X X X X X X X X X X X X X X X X X X X X
2 15 X X X X X X X X X X X X X X X X X X X X X X X X X X
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

OMIM (Online Mendelian Inheritance in Man)

OMIM是一个包含人类基因和遗传疾病信息的在线数据库。它提供了详细的遗传疾病描述、基因定位、相关文献和临床信息。数据集内容包括疾病名称、基因名称、基因定位、遗传模式、临床特征、相关文献引用等。

www.omim.org 收录

RadDet

RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。

github 收录

yolo-datasets

深度学习目标检测数据集/分割数据集最全最完整的数据集集合,包含电力电气领域、航空影像输电线路与输电塔分割、电力遥感风力发电机、安全带和安全绳检测、变压器漏油故障诊断、高压输电线故障检测、光伏热红外缺陷、风电光伏功率数据、变电站火灾、输电线路语义分割、配网缺陷检测、变电站设备目标检测、太阳能光伏电池板缺陷、pcb电路板检测、绝缘体检测、输电线路防震锤缺陷、电线冰雪覆盖、电力工程电网施工现场安全作业、螺丝识别检测、变电站电力设备的可见光和红外图像、无人机航拍输电线路悬垂线夹、电线线路表面损害、氧化锌避雷器破损识别、热斑光伏发电系统红外热图像等多个领域的数据集。

github 收录

HotpotQA

HotpotQA 是收集在英语维基百科上的问答数据集,包含大约 113K 众包问题,这些问题的构建需要两篇维基百科文章的介绍段落才能回答。数据集中的每个问题都带有两个黄金段落,以及这些段落中的句子列表,众包工作人员认为这些句子是回答问题所必需的支持事实。 HotpotQA 提供了多种推理策略,包括涉及问题中缺失实体的问题、交叉问题(什么满足属性 A 和属性 B?)和比较问题,其中两个实体通过一个共同属性进行比较等。在少文档干扰设置中,QA 模型有 10 个段落,保证能找到黄金段落;在开放域全维基设置中,模型只给出问题和整个维基百科。模型根据其答案准确性和可解释性进行评估,其中前者被测量为具有完全匹配 (EM) 和 unigram F1 的预测答案和黄金答案之间的重叠,后者关注预测的支持事实句子与人类注释的匹配程度(Supporting Fact EM/F1)。该数据集还报告了一个联合指标,它鼓励系统同时在两项任务上表现良好。 来源:通过迭代查询生成回答复杂的开放域问题

OpenDataLab 收录