jtatman/stable-diffusion-prompts-stats-full-uncensored
收藏Hugging Face2024-03-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jtatman/stable-diffusion-prompts-stats-full-uncensored
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源于Civitai网站上图像元数据中分享的提示词,主要用于提示词和特征分析。数据集包含了图像ID、URL、提示词、负面提示词、尺寸、模型、统计信息(如评论数、点赞数等)、NSFW标签和评分等特征。数据集的主要目的是进行语义评估、提示词质量分析、有效提示、提示词对齐或不对齐、提示词和类别的统计研究、图像生成方法的流行度分析等。数据集还包含了一个单独的版本,仅包含提示词、负面提示词和模型名称,以便于研究和简洁性。
该数据集来源于Civitai网站上图像元数据中分享的提示词,主要用于提示词和特征分析。数据集包含了图像ID、URL、提示词、负面提示词、尺寸、模型、统计信息(如评论数、点赞数等)、NSFW标签和评分等特征。数据集的主要目的是进行语义评估、提示词质量分析、有效提示、提示词对齐或不对齐、提示词和类别的统计研究、图像生成方法的流行度分析等。数据集还包含了一个单独的版本,仅包含提示词、负面提示词和模型名称,以便于研究和简洁性。
提供机构:
jtatman
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 许可: MIT
- 大小类别: 1M < n < 10M
- 任务类别:
- 图像到图像
- 文本分类
- 文本到图像
- 友好名称: stable diffusion prompts
数据集信息
特征
- image_id: 数据类型为 int64
- url: 数据类型为 string
- prompt: 数据类型为 string
- negative_prompt: 数据类型为 string
- size: 数据类型为 string
- model: 数据类型为 string
- stats: 结构化数据,包含以下字段:
- commentCount: 数据类型为 int64
- cryCount: 数据类型为 int64
- dislikeCount: 数据类型为 int64
- heartCount: 数据类型为 int64
- laughCount: 数据类型为 int64
- likeCount: 数据类型为 int64
- nsfw_label: 数据类型为 string
- nsfw_score: 数据类型为 float64
数据分割
- train:
- 字节数: 877345095
- 样本数: 896874
下载和数据集大小
- 下载大小: 216888972
- 数据集大小: 877345095
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:
标签
- not-for-all-audiences
- nsfw
- uncensored
- art
- stable diffusion
数据集目的
该数据集旨在允许对提示和负面提示进行分析,包括:
- 语义评估(参见 stats 列)
- 提示质量
- 有效提示
- 提示对齐或错位
- 提示和类别的统计研究
- 图像生成方法的流行度
- 特定模型的极简提示
- 将生成的提示与图像匹配以用于 LLAVA 目的
- 最小化提示以更好地使用上下文
- 对兴趣水平和创意方法的社会研究
- 基于提示的模型构建,用于自动化提示生成策略
- 类别兴趣和相似性的模型构建
- 基于模型版本化的提示演化模型构建
其他信息
该数据集包含仅提示、负面提示和模型名称的单独上传,以简洁、避免不适和研究目的。



