five

guangyil/laion-coco-aesthetic

收藏
Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/guangyil/laion-coco-aesthetic
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含LAION-COCO数据集的10%样本,经过一些文本规则(如移除URL、特殊标记等)和图像规则(如图像大小大于384x384、美学评分大于4.75、水印概率小于0.5)的过滤。数据集中共有8,563,753个数据实例,并且包含了美学评分和水印评分。需要注意的是,表格中的水印评分表示图像中存在水印的概率。

This dataset contains 10% of the samples from the LAION-COCO dataset, which has been filtered via two sets of rules: text-based rules (e.g., removing URLs, special tokens, etc.) and image-based rules (e.g., image size larger than 384×384, aesthetic score greater than 4.75, and watermark probability less than 0.5). The dataset comprises a total of 8,563,753 data instances, and includes both aesthetic scores and watermark scores. It should be noted that the watermark scores listed in the table represent the probability that a watermark is present in the corresponding image.
提供机构:
guangyil
原始信息汇总

数据集概述

数据集组成

  • 本数据集包含LAION-COCO数据集的10%样本,经过文本和图像规则筛选。
  • 文本规则包括移除URL和特殊标记等。
  • 图像规则包括图像尺寸大于384x384像素,美学评分大于4.75,水印概率小于0.5。

数据量

  • 数据集总计包含8,563,753个数据实例。

附加信息

  • 每个数据实例均包含相应的美学评分和水印评分。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作