deepghs/character_similarity
收藏Hugging Face2023-11-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/deepghs/character_similarity
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于训练模型以判断两张动漫图像(仅包含一个人物)是否描绘了同一个角色的数据集。数据集包含多个版本,每个版本有不同的字符数量和图像数量,且来源和特点各异。例如,v0版本从zerochan.net爬取,包含Arknights、Fate/Grand Order、Genshin Impact、Girls Frontline和Azur Lane等游戏的图像,以及超过1500个其他游戏或动漫角色的图像。v0_tiny和v0_xtiny是v0的简化版本,分别随机选择了1/4的动漫角色和1/4的图像,以及仅保留了100个角色。v1版本与v0类似,但包含更丰富的角色和更多样化的图像。v1_pruned是从v1中删除了单色和非单人图片,以及角色占整个视觉区域少于40%的图片。v2版本则仅包含所有角色的面部图像,图像尺寸大于v1和v0版本,但可能包含多级嵌套的图像路径。
提供机构:
deepghs
原始信息汇总
数据集概述
数据集名称
- character_similarity
数据集用途
- 用于训练模型以判断两张包含单个人的动漫图片是否描绘同一角色。
数据集版本及详细信息
版本 v0
- 文件名: images_v0.tar.xz
- 角色数量: 2059
- 图片数量: 162116
- 来源: 从 zerochan.net 爬取,包含 Arknights, Fate/Grand Order, Genshin Impact, Girls Frontline, Azur Lane 等游戏或动漫角色,以及其他超过1500个角色的小预览缩略图。
版本 v0_tiny
- 文件名: images_tiny_v0.tar.xz
- 角色数量: 514
- 图片数量: 10036
- 描述: 从
v0数据集中随机选取了1/4的角色和每个角色的1/4图片,推荐用于模型训练和验证。
版本 v0_xtiny
- 文件名: images_xtiny_v0.tar.xz
- 角色数量: 100
- 图片数量: 1814
- 描述:
v0_xtiny是v0_tiny的进一步简化版本,仅保留100个角色,适合用于模型验证和实验,不推荐用于正式训练。
版本 v1
- 文件名: images_v1.tar.xz
- 角色数量: 4001
- 图片数量: 292800
- 描述: 类似于
v0,但包含更丰富的角色选择和更多样化的同一角色图片,每个角色包含不少于3张且不超过200张图片。
版本 v1_pruned
- 文件名: images_pruned_v1.tar.xz
- 角色数量: 3982
- 图片数量: 241483
- 描述: 从
v1数据集中修剪而来,删除了黑白和非单人图片,以及角色占比小于40%的图片。
版本 v2
- 文件名: images_v2.tar.gz
- 角色数量: 37886
- 图片数量: 836217
- 描述: 从 zerochan.net 爬取,仅包含角色面部,图片尺寸大于 v1 和 v0 数据集。请注意,v2 数据集可能包含多级嵌套的图片路径,如
a/b/c/xx.jpg和a/b/yy.jpg。在这种情况下,xx.jpg和yy.jpg不应被视为同一角色。只有当两个角色位于完全相同的文件路径时,才被视为同一角色。
数据集属性
- 许可证: MIT
- 任务类别: zero-shot-classification
- 标签: art
- 大小类别: 100K<n<1M



