BaiqiL/GenAI-Bench

Name: BaiqiL/GenAI-Bench
Creator: BaiqiL
Published: 2024-07-21 16:08:03
License: 暂无描述

Hugging Face2024-07-21 更新2024-06-15 收录

下载链接：

https://hf-mirror.com/datasets/BaiqiL/GenAI-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

GenAI-Bench数据集是一个用于评估和改进组合文本到视觉生成能力的基准数据集。它包含1600个来自专业设计师的文本提示，这些提示涵盖了从基本（场景、属性、关系）到高级（计数、比较、区分、逻辑）的多种组合技能。数据集还包括由DALL-E 3、DeepFloyd_I_XL_v1、Midjourney_6、SDXL_2_1、SDXL_Base和SDXL_Turbo等领先模型生成的图像，以及对这些图像的人类评分（1到5的Likert量表）。此外，数据集还包含基本技能和高级技能的标签，用于进一步分析生成模型的表现。

The GenAI-Bench dataset is a benchmark dataset for evaluating and improving compositional text-to-visual generation capabilities. It contains 1600 text prompts from professional designers, covering diverse compositional skills ranging from basic ones (scene, attribute, relationship) to advanced ones (counting, comparison, differentiation, logical reasoning). The dataset also includes images generated by leading generative models such as DALL-E 3, DeepFloyd_I_XL_v1, Midjourney_6, SDXL_2_1, SDXL_Base and SDXL_Turbo, along with human ratings of these images on a 1-to-5 Likert scale. Furthermore, the dataset provides labels for basic and advanced skills to enable in-depth analysis of generative models' performance.

提供机构：

BaiqiL

原始信息汇总

数据集概述

数据集信息

名称: GenAI-Bench
语言: 英语
许可证: Apache-2.0
大小类别: 1K<n<10K

数据集结构

特征

id: 字符串类型，唯一标识符
prompt: 字符串类型，提示信息
basic_skills: 字符串类型，基本技能标签
advanced_skills: 字符串类型，高级技能标签
DALLE_3: 图像类型
DeepFloyd_I_XL_v1: 图像类型
Midjourney_6: 图像类型
SDXL_2_1: 图像类型
SDXL_Base: 图像类型
SDXL_Turbo: 图像类型

数据实例

python DatasetDict({ train: Dataset({ features: [id, prompt, basic_skills, advanced_skills, DALLE_3, DeepFloyd_I_XL_v1, Midjourney_6, SDXL_2_1, SDXL_Base, SDXL_Turbo], num_rows: 1600 }) })

数据字段

id: 唯一标识符，字符串类型
prompt: 提示信息，字符串类型
basic_skills: 基本技能标签，字符串类型
advanced_skills: 高级技能标签，字符串类型
DALLE_3: 由DALLE_3生成的图像，图像类型
Midjourney_6: 由Midjourney_6生成的图像，图像类型
DeepFloyd_I_XL_v1: 由DeepFloyd_I_XL_v1生成的图像，图像类型
SDXL_2_1: 由SDXL_2_1生成的图像，图像类型
SDXL_Base: 由SDXL_Base生成的图像，图像类型
SDXL_Turbo: 由SDXL_Turbo生成的图像，图像类型
Human Rating: 人类对每个生成图像的评分，字典类型

统计信息

GenAI-Bench:
- 提示数量: 1600
- 技能标签数量: 5,000+
- 图像数量: 9,600
- 视频数量: --
- 人类评分数量: 28,800

数据来源

提示: 来自专业设计师，使用工具如Midjourney和CIVITAI
多重组合标签: 每个提示的标签由人工标注者验证
生成图像: 使用1,600个GenAI-Bench提示从DALLE_3, DeepFloyd_I_XL_v1, Midjourney_6, SDXL_2_1, SDXL_Base和SDXL_Turbo生成
生成视频: 使用800个GenAI-Bench提示从Pika, Gen2, ModelScope和Floor33生成
人类评分: 雇佣三名训练有素的人工标注者对每个生成的图像/视频进行评分