five

hayden-donnelly/db-sfw-512px-character-filter

收藏
Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/hayden-donnelly/db-sfw-512px-character-filter
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于训练一个简单的二分类器,以过滤Danbooru SFW 2021数据集中的图像。分类标准包括图像是否聚焦于一个或多个角色,角色是否清晰且不被背景淹没,以及角色是否不在嘈杂的漫画条中。被接受的样本应满足以下条件:1. 聚焦于一个或多个角色,包括非人类角色如动物、人形机甲和拟人化机器人,但不包括车辆和其他非拟人化机器。2. 角色清晰且不被背景淹没,角色不应与背景相比过小,且应与背景有足够的对比度。3. 角色不在嘈杂的漫画条中,除非漫画条简单且中心角色易于通过裁剪提取。

该数据集用于训练一个简单的二分类器,以过滤Danbooru SFW 2021数据集中的图像。分类标准包括图像是否聚焦于一个或多个角色,角色是否清晰且不被背景淹没,以及角色是否不在嘈杂的漫画条中。被接受的样本应满足以下条件:1. 聚焦于一个或多个角色,包括非人类角色如动物、人形机甲和拟人化机器人,但不包括车辆和其他非拟人化机器。2. 角色清晰且不被背景淹没,角色不应与背景相比过小,且应与背景有足够的对比度。3. 角色不在嘈杂的漫画条中,除非漫画条简单且中心角色易于通过裁剪提取。
提供机构:
hayden-donnelly
原始信息汇总

Danbooru SFW 512px Character Filter 数据集概述

数据集用途

该数据集旨在用于训练一个简单的二分类器,以过滤 Danbooru SFW 2021 数据集。数据集包含两个类别:“accepted” 和 “rejected”。其中,“accepted” 表示样本应通过过滤器,而 “rejected” 表示样本不应通过过滤器。

数据集分类标准

要被接受(即归类为“accepted”),样本应满足以下标准:

  1. 聚焦于一个或一组角色。这包括非人类角色,如动物、人形机甲和拟人化机器人,但不包括车辆和其他非拟人化机器。例如,宝可梦、高达和R2-D2符合此标准,但坦克、机械臂和无人机不符合。
  2. 角色清晰,不被背景淹没。这意味着角色不应相对于大型背景显得太小。它们还应与背景有足够的对比度,以免与背景融合。
  3. 角色不是以嘈杂的漫画条形式呈现。如果漫画条简单且中心角色易于通过裁剪提取,则允许一些漫画条。注意,此标准的第二部分有些不一致,通常倾向于拒绝所有漫画条。

原始数据集引用

bibtex @misc{danbooru2021, author={Anonymous and Danbooru community and Gwern Branwen}, title={Danbooru2021: A Large-Scale Crowdsourced and Tagged Anime Illustration Dataset}, howpublished={url{https://gwern.net/danbooru2021}}, url={https://gwern.net/danbooru2021}, type={dataset}, year={2022}, month={January}, timestamp={2022-01-21}, note={Accessed: 2023-12-06} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作