five

thruway/e621_samples_2022-12-28

收藏
Hugging Face2022-12-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/thruway/e621_samples_2022-12-28
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了从e621.net网站生成之日起的所有评级的图像,以及相关的元数据。元数据包括帖子ID、创建时间、更新时间、标签(以ID形式存储,可从e621标签转储中交叉引用)、评级(0 = 安全,1 = 可疑,2 = 明确)、收藏次数、评论次数、点赞分数和点踩分数。数据集排除了在抓取时处于待定状态或被标记为在大多数司法管辖区非法的图像。此外,数据集中可能存在一些损坏的文件,建议在处理代码中处理无效图像。
提供机构:
thruway
原始信息汇总

数据集概述

数据集特征

  • id: 数据类型为uint32
  • created_at: 数据类型为timestamp[us]
  • updated_at: 数据类型为timestamp[us]
  • image: 数据类型为image
  • tags: 数据类型为sequence,具体为uint32
  • rating: 数据类型为uint8
  • fav_count: 数据类型为uint32
  • comment_count: 数据类型为uint32
  • up_score: 数据类型为int32
  • down_score: 数据类型为int32

数据集分割

  • train: 包含3065570个样本,数据集大小为384353755927.75字节,下载大小为382556768725字节。

数据集内容

  • 包含所有评级的图像,以及以下元数据:
    • 帖子ID
    • 创建时间
    • 更新时间
    • 标签(存储为ID,可与e621标签转储交叉引用)
    • 评级(0=安全,1=可疑,2=明确)
    • 收藏次数
    • 评论次数
    • 正面评分
    • 负面评分

数据集排除内容

  • 排除处于待处理状态的图像。
  • 排除标记为在大多数司法管辖区非法拥有的图像。

注意事项

  • 数据集中可能包含损坏的文件,处理代码需能处理无效图像。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作