wanng/midjourney-kaggle-clean
收藏Hugging Face2023-05-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/wanng/midjourney-kaggle-clean
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是对Kaggle上的Midjourney User Prompts & Generated Images数据集进行清理后的结果,共包含248,167对数据。数据集分为两个文件:ori.parquet(145,918对,midjourney的四格图)和upscaled.parquet(102,249对,使用了高清指令的图,这意味着这个图更受欢迎)。数据集包含多列信息,如内容、网址、代理网址、宽度、高度、日期、消息类型、内容链接、提示、提示补充、用户名、宽高比和清理后的提示等。
提供机构:
wanng
原始信息汇总
数据集概述
数据集名称
midjourney-v5-202304-clean
数据集简介
本数据集是对Kaggle上的Midjourney User Prompts & Generated Images (250k)数据集进行非官方清理后的版本,共包含248,167对数据。
数据集文件
ori.parquet:包含145,918对数据,对应midjourney的四格图。upscaled.parquet:包含102,249对数据,这些图像使用了高清指令,表明这些图像更受欢迎。
列信息
content(内容): 包含消息的主要内容,可能包括文本、链接、或其他元素。url(网址): 包含附件的URL,通常是图片或其他文件。proxy_url(代理网址): 包含附件的代理URL,用于在原始URL不可用时访问附件。width(宽度): 包含附件的宽度,通常是图片的宽度。height(高度): 包含附件的高度,通常是图片的高度。date(日期): 包含消息的发送日期和时间。message_type(消息类型): 包含消息的类型,如初始消息、变体请求或放大请求。content_links(内容链接): 包含消息内容中的所有链接。prompt(提示): 包含消息中的主要提示,通常是用户输入的文本。prompt_additions(提示补充): 包含消息中的提示补充,可能包括额外的信息或指示。user_name(用户名): 包含发送消息的用户的用户名。aspect(宽高比): 包含附件的宽高比,通常是图片的宽高比。clean_prompts(清理后的提示): 包含清理后的提示,已删除所有链接和奇怪的字符。
许可证
本数据集遵循CC0-1.0许可证。
任务类别
- image-to-text
- text-to-image
语言
- en
标签
- midjourney
- kaggle



