five

incantor/user-pref-filtered-115k-ft

收藏
Hugging Face2023-07-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/incantor/user-pref-filtered-115k-ft
下载链接
链接失效反馈
官方服务:
资源简介:
User Preference Dataset 75k数据集包含原始数据、元数据和处理后的数据。原始数据包括jsonl文件和图片,元数据包括图片URL、WD Tagger、GPT prompt、GPT response、GPT similarity等信息。处理后的数据包括用于训练的75k数据,这些数据经过了清洗和过滤处理。

User Preference Dataset 75k数据集包含原始数据、元数据和处理后的数据。原始数据包括jsonl文件和图片,元数据包括图片URL、WD Tagger、GPT prompt、GPT response、GPT similarity等信息。处理后的数据包括用于训练的75k数据,这些数据经过了清洗和过滤处理。
提供机构:
incantor
原始信息汇总

数据集概述

数据集名称

  • 名称: User Preference Dataset 75k

原始数据

元数据

  • 文件: pref_115k_gpt_usable_merged.snappy.parquet
  • 内容: 包含图片URL, WD Tagger, GPT prompt, GPT response, GPT similarity。
  • 详细信息:
    • tagger: wd14-convnext-v2-v2 tagger
    • gpt: gpt3.5 turbo 0610
    • similarity: laion/CLIP-ViT-L-14-DataComp.XL-s13B-b90K
    • clip aesthetic score: openai/clip VIT-L

衍生数据

处理步骤

  • 读入: pref_jsons (来自另一个aws org)
  • 处理: data-processings (github)
    • 清洗后: jsonl_cleaned/
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作