JohnTeddy3/midjourney-v5-202304
收藏Hugging Face2023-08-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/JohnTeddy3/midjourney-v5-202304
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个非官方的数据集,爬取自midjourney v5的2023年4月的数据,总共包含1,701,420对图像和文本。数据集经过清洗后,分为两个文件:ori_prompts_df.parquet包含1,255,812对midjourney的四格图,upscaled_prompts_df.parquet包含445,608对使用了高清指令的图,这些图因为使用了高清指令而更受欢迎。
license: apache-2.0
task_categories:
- 文本到图像(text-to-image)
- 图像到文本(image-to-text)
language:
- 英语(en)
tags:
- midjourney
---
# midjourney-v5-202304-clean
## 简介
本数据集转载自wanng/midjourney-v5-202304-clean,为非官方采集的数据集,数据爬取自2023年4月发布的midjourney v5平台,总计包含1,701,420条提示-图像对。
## 数据集信息
原始项目地址:https://huggingface.co/datasets/tarungupta83/MidJourney_v5_Prompt_dataset
本次发布的数据集经过清洗处理,生成以下两个数据文件:
- ori_prompts_df.parquet:包含1,255,812条提示-图像对,对应midjourney生成的四格预览图像

- upscaled_prompts_df.parquet:包含445,608条提示-图像对,对应使用了高清放大(Upscale)指令生成的图像,这类图像通常更受用户青睐。

提供机构:
JohnTeddy3
原始信息汇总
midjourney-v5-202304-clean 数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别:
- 文本到图像
- 图像到文本
- 语言: 英语
- 标签: midjourney
数据集描述
- 来源: 非官方,爬取自midjourney v5的2023年4月数据。
- 数据量: 总共1,701,420对。
数据集内容
- ori_prompts_df.parquet:
- 包含1,255,812对数据,对应midjourney的四格图。
- upscaled_prompts_df.parquet:
- 包含445,608对数据,这些图像使用了高清指令,表明这些图像更受欢迎。



