five

deepghs/character_similarity

收藏
Hugging Face2023-11-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/deepghs/character_similarity
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于训练模型以判断两张动漫图像(仅包含一个人物)是否描绘了同一个角色的数据集。数据集包含多个版本,每个版本有不同的字符数量和图像数量,且来源和特点各异。例如,v0版本从zerochan.net爬取,包含Arknights、Fate/Grand Order、Genshin Impact、Girls Frontline和Azur Lane等游戏的图像,以及超过1500个其他游戏或动漫角色的图像。v0_tiny和v0_xtiny是v0的简化版本,分别随机选择了1/4的动漫角色和1/4的图像,以及仅保留了100个角色。v1版本与v0类似,但包含更丰富的角色和更多样化的图像。v1_pruned是从v1中删除了单色和非单人图片,以及角色占整个视觉区域少于40%的图片。v2版本则仅包含所有角色的面部图像,图像尺寸大于v1和v0版本,但可能包含多级嵌套的图像路径。
提供机构:
deepghs
原始信息汇总

数据集概述

数据集名称

  • character_similarity

数据集用途

  • 用于训练模型以判断两张包含单个人的动漫图片是否描绘同一角色。

数据集版本及详细信息

版本 v0

  • 文件名: images_v0.tar.xz
  • 角色数量: 2059
  • 图片数量: 162116
  • 来源: 从 zerochan.net 爬取,包含 Arknights, Fate/Grand Order, Genshin Impact, Girls Frontline, Azur Lane 等游戏或动漫角色,以及其他超过1500个角色的小预览缩略图。

版本 v0_tiny

  • 文件名: images_tiny_v0.tar.xz
  • 角色数量: 514
  • 图片数量: 10036
  • 描述: 从 v0 数据集中随机选取了1/4的角色和每个角色的1/4图片,推荐用于模型训练和验证。

版本 v0_xtiny

  • 文件名: images_xtiny_v0.tar.xz
  • 角色数量: 100
  • 图片数量: 1814
  • 描述: v0_xtinyv0_tiny 的进一步简化版本,仅保留100个角色,适合用于模型验证和实验,不推荐用于正式训练。

版本 v1

  • 文件名: images_v1.tar.xz
  • 角色数量: 4001
  • 图片数量: 292800
  • 描述: 类似于 v0,但包含更丰富的角色选择和更多样化的同一角色图片,每个角色包含不少于3张且不超过200张图片。

版本 v1_pruned

  • 文件名: images_pruned_v1.tar.xz
  • 角色数量: 3982
  • 图片数量: 241483
  • 描述: 从 v1 数据集中修剪而来,删除了黑白和非单人图片,以及角色占比小于40%的图片。

版本 v2

  • 文件名: images_v2.tar.gz
  • 角色数量: 37886
  • 图片数量: 836217
  • 描述: 从 zerochan.net 爬取,仅包含角色面部,图片尺寸大于 v1 和 v0 数据集。请注意,v2 数据集可能包含多级嵌套的图片路径,如 a/b/c/xx.jpga/b/yy.jpg。在这种情况下,xx.jpgyy.jpg 不应被视为同一角色。只有当两个角色位于完全相同的文件路径时,才被视为同一角色。

数据集属性

  • 许可证: MIT
  • 任务类别: zero-shot-classification
  • 标签: art
  • 大小类别: 100K<n<1M
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作