five

aklein4/coyo-hd-filtered

收藏
Hugging Face2024-07-07 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/aklein4/coyo-hd-filtered
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含图像相关的多种特征,包括图像URL、不同类型的标题、标签、关键值、CLIP相似度评分、NSFW评分、水印评分、美学评分、人脸数量、图像尺寸、EXIF信息和SHA256哈希值。数据集分为训练集、验证集和测试集,分别包含不同数量的样本和字节大小。

This dataset includes various image-related features such as image URL, long and short captions, tags, image attributes (like width and height), safety scores, aesthetic scores, etc. The dataset is divided into train, validation, and test splits, each with specified amounts of data and sizes.
提供机构:
aklein4
原始信息汇总

数据集概述

特征信息

  • url: 字符串类型
  • caption_llava: 字符串类型
  • caption_llava_short: 字符串类型
  • caption: 字符串类型
  • tags_open_images: 字符串类型
  • tags_booru: 字符串类型
  • key: 64位整数类型
  • clip_similarity_vitb32: 64位浮点数类型
  • clip_similarity_vitl14: 64位浮点数类型
  • nsfw_score_opennsfw2: 64位浮点数类型
  • nsfw_score_gantman: 64位浮点数类型
  • watermark_score: 64位浮点数类型
  • aesthetic_score_laion_v2: 64位浮点数类型
  • num_faces: 64位整数类型
  • width: 64位整数类型
  • height: 64位整数类型
  • exif: 字符串类型
  • sha256: 字符串类型

数据集划分

  • train:
    • 字节数: 1358560669.4180129
    • 样本数: 1022889
  • validation:
    • 字节数: 75475371.38537751
    • 样本数: 56827
  • test:
    • 字节数: 75476699.5457834
    • 样本数: 56828

数据集大小

  • 下载大小: 660600017 字节
  • 总大小: 1509512740.3491735 字节

配置信息

  • config_name: default
    • data_files:
      • train: data/train-*
      • validation: data/validation-*
      • test: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作