guangyil/laion-coco-aesthetic
收藏Hugging Face2023-11-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/guangyil/laion-coco-aesthetic
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含LAION-COCO数据集的10%样本,经过一些文本规则(如移除URL、特殊标记等)和图像规则(如图像大小大于384x384、美学评分大于4.75、水印概率小于0.5)的过滤。数据集中共有8,563,753个数据实例,并且包含了美学评分和水印评分。需要注意的是,表格中的水印评分表示图像中存在水印的概率。
This dataset contains 10% of the samples from the LAION-COCO dataset, which has been filtered via two sets of rules: text-based rules (e.g., removing URLs, special tokens, etc.) and image-based rules (e.g., image size larger than 384×384, aesthetic score greater than 4.75, and watermark probability less than 0.5). The dataset comprises a total of 8,563,753 data instances, and includes both aesthetic scores and watermark scores. It should be noted that the watermark scores listed in the table represent the probability that a watermark is present in the corresponding image.
提供机构:
guangyil
原始信息汇总
数据集概述
数据集组成
- 本数据集包含LAION-COCO数据集的10%样本,经过文本和图像规则筛选。
- 文本规则包括移除URL和特殊标记等。
- 图像规则包括图像尺寸大于384x384像素,美学评分大于4.75,水印概率小于0.5。
数据量
- 数据集总计包含8,563,753个数据实例。
附加信息
- 每个数据实例均包含相应的美学评分和水印评分。



