five

JohnTeddy3/text2image-multi-prompt

收藏
Hugging Face2023-08-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/JohnTeddy3/text2image-multi-prompt
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是多个文本到图像提示数据集的集合,经过清理和规范化处理,去除了特定模型的API,并进行了基本的去重。数据集包含训练集和测试集,分别有3551734和399393行数据,每行数据包含text和src_dataset两个特征。由于其他两个数据集没有验证集,succinctly/midjourney-prompts的验证集被合并到了训练集中。

该数据集是多个文本到图像提示数据集的集合,经过清理和规范化处理,去除了特定模型的API,并进行了基本的去重。数据集包含训练集和测试集,分别有3551734和399393行数据,每行数据包含text和src_dataset两个特征。由于其他两个数据集没有验证集,succinctly/midjourney-prompts的验证集被合并到了训练集中。
提供机构:
JohnTeddy3
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 语言: 英语
  • 多语言性: 单语种
  • 美观名称: multi text2image prompts a dataset collection

数据来源

  • 源数据集:
    • bartman081523/stable-diffusion-discord-prompts
    • succinctly/midjourney-prompts
    • Gustavosta/Stable-Diffusion-Prompts

数据集内容

  • 描述: 包含多个text2image提示数据集的集合
  • 数据处理: 数据经过清洗和标准化,移除了特定模型的API参数,如Midjourney的"--ar"等
  • 数据去重: 在清洗和标准化后,完全重复的提示被删除

数据集结构

  • 训练集:
    • 特征: [text, src_dataset]
    • 行数: 3551734
  • 测试集:
    • 特征: [text, src_dataset]
    • 行数: 399393

注意事项

  • 验证集: 由于其他两个数据集没有validation分割,succinctly/midjourney-prompts的验证分割被合并到train中。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作