OpenGVLab_Lumina_t2i_human_preference

Hugging Face2025-02-26 更新2025-02-27 收录

下载链接：

https://huggingface.co/datasets/Rapidata/OpenGVLab_Lumina_t2i_human_preference

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个文本到图像（T2I）的评估数据集，包含了超过400k的人类反馈，用于评估Lumina模型在偏好、一致性和对齐三个类别上的表现。数据集包含了与Lumina-15-2-25和其他八个模型之间的1v1比较结果。

创建时间：

2025-02-22

搜集汇总

数据集介绍

构建方式

OpenGVLab_Lumina_t2i_human_preference数据集的构建采取了对Lumina-15-2-25与其他模型进行1v1比较的方式，涵盖了偏好、连贯性和对齐性三个维度的评估。数据收集过程中，通过用户界面手动收集了图片，并邀请超过86000名注释者参与，在短短两天内收集了超过40万份人类反馈。

特点

该数据集的特点在于其庞大的规模和全面的评估维度。不仅包含了人类对图像的偏好选择，还包括了对图像连贯性和与提示对齐性的评估。数据集覆盖了多种模型，包括Lumina、Aurora、imagen-3等多个版本，为研究者提供了丰富的对比研究资源。

使用方法

使用该数据集时，研究者可以依据其提供的详细评估结果，包括偏好、连贯性和对齐性的分数，对不同的图像生成模型进行性能比较和分析。数据集的规模使得其非常适合用于大规模的模型评估和基准测试。

背景与挑战

背景概述

OpenGVLab_Lumina_t2i_human_preference数据集，由OpenGVLab创建，旨在评估 Lumina 模型在文本到图像（Text-to-Image，T2I）任务中的人类偏好。该数据集收集了超过86,000名注释者在约两天内提供的超过400,000条人类反馈，使用了Rapidata Python API进行数据收集。该数据集的主要研究问题是衡量Lumina模型在不同类别中的偏好、连贯性和对齐性，涉及到的任务类别包括文本到图像、图像到文本、图像分类以及强化学习。该数据集的创建对于研究人工智能在图像生成领域的表现具有重要的参考价值，为相关领域的研究提供了丰富的实验数据。

当前挑战

该数据集在构建过程中面临的挑战主要包括：1) 如何高效地收集大量的人类反馈数据，确保数据的多样性和准确性；2) 如何在不同模型之间进行公平的比较，特别是在偏好、连贯性和对齐性这三个维度上；3) 数据集的规模和多样性可能带来的处理和分析挑战。在所解决的领域问题上，该数据集面临的挑战是如何准确捕捉和量化人类在图像生成结果上的偏好，这对于提升图像生成模型的质量和用户满意度至关重要。

常用场景

经典使用场景

OpenGVLab_Lumina_t2i_human_preference数据集是一组针对文本到图像任务的人类偏好评估数据。该数据集在文本到图像的偏好、连贯性和对齐性三个维度上收集了超过40万份人类响应，其经典使用场景在于对生成图像模型进行人类偏好评估，以量化不同模型在视觉上的吸引力、逻辑一致性和与提示的匹配程度。

衍生相关工作

基于该数据集，研究者可以开展一系列相关工作，如深入分析人类偏好与图像特征之间的关系，开发新的图像评估指标，以及探索更高效的图像生成和评估方法，推动AI领域在图像生成技术上的创新和发展。

数据集最近研究