JohnTeddy3/text2image-multi-prompt
收藏Hugging Face2023-08-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/JohnTeddy3/text2image-multi-prompt
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是多个文本到图像提示数据集的集合,经过清理和规范化处理,去除了特定模型的API,并进行了基本的去重。数据集包含训练集和测试集,分别有3551734和399393行数据,每行数据包含text和src_dataset两个特征。由于其他两个数据集没有验证集,succinctly/midjourney-prompts的验证集被合并到了训练集中。
该数据集是多个文本到图像提示数据集的集合,经过清理和规范化处理,去除了特定模型的API,并进行了基本的去重。数据集包含训练集和测试集,分别有3551734和399393行数据,每行数据包含text和src_dataset两个特征。由于其他两个数据集没有验证集,succinctly/midjourney-prompts的验证集被合并到了训练集中。
提供机构:
JohnTeddy3
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 语言: 英语
- 多语言性: 单语种
- 美观名称: multi text2image prompts a dataset collection
数据来源
- 源数据集:
- bartman081523/stable-diffusion-discord-prompts
- succinctly/midjourney-prompts
- Gustavosta/Stable-Diffusion-Prompts
数据集内容
- 描述: 包含多个text2image提示数据集的集合
- 数据处理: 数据经过清洗和标准化,移除了特定模型的API参数,如Midjourney的"--ar"等
- 数据去重: 在清洗和标准化后,完全重复的提示被删除
数据集结构
- 训练集:
- 特征: [text, src_dataset]
- 行数: 3551734
- 测试集:
- 特征: [text, src_dataset]
- 行数: 399393
注意事项
- 验证集: 由于其他两个数据集没有
validation分割,succinctly/midjourney-prompts的验证分割被合并到train中。



