five

hayden-donnelly/db-sfw-512px-general-filter

收藏
Hugging Face2024-03-10 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/hayden-donnelly/db-sfw-512px-general-filter
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集旨在用于训练一个简单的二元分类器,以过滤Danbooru SFW 2021数据集。数据集包含两个类别:accepted(接受)和rejected(拒绝),分别代表应通过过滤的样本和不应通过的样本。接受的样本需满足以下条件:1. 无水平/垂直条或可通过填充背景颜色轻松移除的条;2. 非明显性暗示;3. 具有一定的美学价值。数据集样本是手动选择的,尽管在速度和准确性之间存在权衡,但已成功训练出达到85%测试准确率的分类器。

该数据集旨在用于训练一个简单的二元分类器,以过滤Danbooru SFW 2021数据集。数据集包含两个类别:accepted(接受)和rejected(拒绝),分别代表应通过过滤的样本和不应通过的样本。接受的样本需满足以下条件:1. 无水平/垂直条或可通过填充背景颜色轻松移除的条;2. 非明显性暗示;3. 具有一定的美学价值。数据集样本是手动选择的,尽管在速度和准确性之间存在权衡,但已成功训练出达到85%测试准确率的分类器。
提供机构:
hayden-donnelly
原始信息汇总

Danbooru SFW 512px General Filter 数据集概述

数据集用途

该数据集用于训练一个简单的二分类器,以过滤 Danbooru SFW 2021 数据集。数据集包含两个类别:“accepted” 和 “rejected”。其中,“accepted” 表示样本应通过过滤器,“rejected” 表示样本不应通过过滤器。

样本接受标准

要被接受,样本应满足以下条件:

  1. 没有水平/垂直条,或可以通过填充背景颜色轻松去除的条。这排除了任何带有条的样本,这些条穿过图像的非纯色块部分(即图案、详细背景和前景元素)。
  2. 不具有明显的性暗示。该数据集基于 Danbooru 2021 的 SFW 子集,已移除几乎所有裸露内容,此标准仅移除一些边缘 NSFW 图像。
  3. 具有一定的审美价值。

数据集特点

  • 数据集样本是手动选择的,因此在速度和准确性之间存在一定的权衡。
  • 尽管如此,作者已成功训练出一个在测试集上达到 85% 准确率的二分类器,并在新的数据集部分表现出良好的性能。

原始数据集引用

bibtex @misc{danbooru2021, author={Anonymous and Danbooru community and Gwern Branwen}, title={Danbooru2021: A Large-Scale Crowdsourced and Tagged Anime Illustration Dataset}, howpublished={url{https://gwern.net/danbooru2021}}, url={https://gwern.net/danbooru2021}, type={dataset}, year={2022}, month={January}, timestamp={2022-01-21}, note={Accessed: 2023-12-06} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作