five

wanng/midjourney-kaggle-clean

收藏
Hugging Face2023-05-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/wanng/midjourney-kaggle-clean
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是对Kaggle上的Midjourney User Prompts & Generated Images数据集进行清理后的结果,共包含248,167对数据。数据集分为两个文件:ori.parquet(145,918对,midjourney的四格图)和upscaled.parquet(102,249对,使用了高清指令的图,这意味着这个图更受欢迎)。数据集包含多列信息,如内容、网址、代理网址、宽度、高度、日期、消息类型、内容链接、提示、提示补充、用户名、宽高比和清理后的提示等。
提供机构:
wanng
原始信息汇总

数据集概述

数据集名称

midjourney-v5-202304-clean

数据集简介

本数据集是对Kaggle上的Midjourney User Prompts & Generated Images (250k)数据集进行非官方清理后的版本,共包含248,167对数据。

数据集文件

  • ori.parquet:包含145,918对数据,对应midjourney的四格图。
  • upscaled.parquet:包含102,249对数据,这些图像使用了高清指令,表明这些图像更受欢迎。

列信息

  1. content (内容): 包含消息的主要内容,可能包括文本、链接、或其他元素。
  2. url (网址): 包含附件的URL,通常是图片或其他文件。
  3. proxy_url (代理网址): 包含附件的代理URL,用于在原始URL不可用时访问附件。
  4. width (宽度): 包含附件的宽度,通常是图片的宽度。
  5. height (高度): 包含附件的高度,通常是图片的高度。
  6. date (日期): 包含消息的发送日期和时间。
  7. message_type (消息类型): 包含消息的类型,如初始消息、变体请求或放大请求。
  8. content_links (内容链接): 包含消息内容中的所有链接。
  9. prompt (提示): 包含消息中的主要提示,通常是用户输入的文本。
  10. prompt_additions (提示补充): 包含消息中的提示补充,可能包括额外的信息或指示。
  11. user_name (用户名): 包含发送消息的用户的用户名。
  12. aspect (宽高比): 包含附件的宽高比,通常是图片的宽高比。
  13. clean_prompts (清理后的提示): 包含清理后的提示,已删除所有链接和奇怪的字符。

许可证

本数据集遵循CC0-1.0许可证。

任务类别

  • image-to-text
  • text-to-image

语言

  • en

标签

  • midjourney
  • kaggle
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作