thruway/e621_samples_2022-12-28
收藏Hugging Face2022-12-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/thruway/e621_samples_2022-12-28
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了从e621.net网站生成之日起的所有评级的图像,以及相关的元数据。元数据包括帖子ID、创建时间、更新时间、标签(以ID形式存储,可从e621标签转储中交叉引用)、评级(0 = 安全,1 = 可疑,2 = 明确)、收藏次数、评论次数、点赞分数和点踩分数。数据集排除了在抓取时处于待定状态或被标记为在大多数司法管辖区非法的图像。此外,数据集中可能存在一些损坏的文件,建议在处理代码中处理无效图像。
提供机构:
thruway
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为
uint32。 - created_at: 数据类型为
timestamp[us]。 - updated_at: 数据类型为
timestamp[us]。 - image: 数据类型为
image。 - tags: 数据类型为
sequence,具体为uint32。 - rating: 数据类型为
uint8。 - fav_count: 数据类型为
uint32。 - comment_count: 数据类型为
uint32。 - up_score: 数据类型为
int32。 - down_score: 数据类型为
int32。
数据集分割
- train: 包含3065570个样本,数据集大小为384353755927.75字节,下载大小为382556768725字节。
数据集内容
- 包含所有评级的图像,以及以下元数据:
- 帖子ID
- 创建时间
- 更新时间
- 标签(存储为ID,可与e621标签转储交叉引用)
- 评级(0=安全,1=可疑,2=明确)
- 收藏次数
- 评论次数
- 正面评分
- 负面评分
数据集排除内容
- 排除处于待处理状态的图像。
- 排除标记为在大多数司法管辖区非法拥有的图像。
注意事项
- 数据集中可能包含损坏的文件,处理代码需能处理无效图像。



