five

jtatman/stable-diffusion-prompts-stats-full-uncensored

收藏
Hugging Face2024-03-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jtatman/stable-diffusion-prompts-stats-full-uncensored
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来源于Civitai网站上图像元数据中分享的提示词,主要用于提示词和特征分析。数据集包含了图像ID、URL、提示词、负面提示词、尺寸、模型、统计信息(如评论数、点赞数等)、NSFW标签和评分等特征。数据集的主要目的是进行语义评估、提示词质量分析、有效提示、提示词对齐或不对齐、提示词和类别的统计研究、图像生成方法的流行度分析等。数据集还包含了一个单独的版本,仅包含提示词、负面提示词和模型名称,以便于研究和简洁性。

该数据集来源于Civitai网站上图像元数据中分享的提示词,主要用于提示词和特征分析。数据集包含了图像ID、URL、提示词、负面提示词、尺寸、模型、统计信息(如评论数、点赞数等)、NSFW标签和评分等特征。数据集的主要目的是进行语义评估、提示词质量分析、有效提示、提示词对齐或不对齐、提示词和类别的统计研究、图像生成方法的流行度分析等。数据集还包含了一个单独的版本,仅包含提示词、负面提示词和模型名称,以便于研究和简洁性。
提供机构:
jtatman
原始信息汇总

数据集概述

基本信息

  • 语言: 英语
  • 许可: MIT
  • 大小类别: 1M < n < 10M
  • 任务类别:
    • 图像到图像
    • 文本分类
    • 文本到图像
  • 友好名称: stable diffusion prompts

数据集信息

特征

  • image_id: 数据类型为 int64
  • url: 数据类型为 string
  • prompt: 数据类型为 string
  • negative_prompt: 数据类型为 string
  • size: 数据类型为 string
  • model: 数据类型为 string
  • stats: 结构化数据,包含以下字段:
    • commentCount: 数据类型为 int64
    • cryCount: 数据类型为 int64
    • dislikeCount: 数据类型为 int64
    • heartCount: 数据类型为 int64
    • laughCount: 数据类型为 int64
    • likeCount: 数据类型为 int64
  • nsfw_label: 数据类型为 string
  • nsfw_score: 数据类型为 float64

数据分割

  • train:
    • 字节数: 877345095
    • 样本数: 896874

下载和数据集大小

  • 下载大小: 216888972
  • 数据集大小: 877345095

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*

标签

  • not-for-all-audiences
  • nsfw
  • uncensored
  • art
  • stable diffusion

数据集目的

该数据集旨在允许对提示和负面提示进行分析,包括:

  • 语义评估(参见 stats 列)
  • 提示质量
  • 有效提示
  • 提示对齐或错位
  • 提示和类别的统计研究
  • 图像生成方法的流行度
  • 特定模型的极简提示
  • 将生成的提示与图像匹配以用于 LLAVA 目的
  • 最小化提示以更好地使用上下文
  • 对兴趣水平和创意方法的社会研究
  • 基于提示的模型构建,用于自动化提示生成策略
  • 类别兴趣和相似性的模型构建
  • 基于模型版本化的提示演化模型构建

其他信息

该数据集包含仅提示、负面提示和模型名称的单独上传,以简洁、避免不适和研究目的。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作