Flux_SD3_MJ_Dalle_Human_Preference_Dataset

Hugging Face2024-11-08 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/Rapidata/Flux_SD3_MJ_Dalle_Human_Preference_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个用于文本到图像模型的大型人类偏好数据集，包含超过70万个人类偏好投票，这些投票在48小时内收集完成。它比较了四个领先的AI模型（Flux.1、DALL-E 3、MidJourney和Stable Diffusion）生成的图像。数据集包括成对比较、丰富的用户人口统计数据，并从145个国家的参与者中收集。它是更大范围评估的一部分，专注于图像连贯性和文本图像对齐。

创建时间：

2024-11-07

原始信息汇总

Flux vs. Dalle3 vs. Midjourney vs. Stabel Diffusion - Human Preference Dataset

概述

该数据集是用于文本到图像模型的最大人类偏好数据集之一，包含超过700,000个人类偏好投票，占我们完整200万投票集合的三分之一。该偏好数据集是与领先AI模型（包括Flux.1、DALL-E 3、MidJourney和Stable Diffusion）生成的图像进行比较的更大评估的一部分。完整的集合还包括两个同样大小的数据集，专注于图像连贯性和文本图像对齐。

关键特征

大规模: 在48小时内收集了超过700,000个个人类偏好投票。
全球代表性: 从145个国家的144,292名参与者中收集。
多样化的提示: 282个精心策划的提示测试图像生成的各个方面。
领先模型: 四个最先进的图像生成模型之间的比较。
严格的方法论: 使用成对比较，并内置质量控制。
丰富的用户数据: 包括关于年龄、性别和地理位置的注释者信息。

应用

该数据集对于以下方面非常有价值：

训练和微调图像生成模型
理解全球对AI生成图像的偏好
开发更好的生成模型评估指标
研究跨文化审美偏好
基准测试新的图像生成模型

数据收集

通过Rapidata的创新注释平台，传统上需要数周或数月的数据收集工作在48小时内完成。我们的技术支持：

大规模快速数据收集
全球145个以上国家的覆盖
内置质量保证机制
全面的代表性
成本效益高的大规模注释

引用

如果您在研究中使用此数据集，请引用我们的Startup Rapidata和我们的论文："Finding the Subjective Truth: Collecting 2 Million Votes for Comprehensive Gen-AI Model Evaluation" (arXiv:2409.11904v2)

搜集汇总

数据集介绍

构建方式

Flux_SD3_MJ_Dalle_Human_Preference_Dataset的构建依托于Rapidata Python API，通过全球144,292名参与者对四种领先的图像生成模型（Flux.1、DALL-E 3、MidJourney和Stable Diffusion）进行成对比较，收集了超过70万条人类偏好投票。数据收集过程仅耗时48小时，展示了Rapidata在大规模人类反馈收集中的高效性。数据集涵盖了282个精心设计的提示，测试了图像生成的多个方面，并包含了丰富的注释者人口统计信息。

特点

该数据集以其大规模和全球代表性著称，包含了来自145个国家的参与者，确保了数据的多样性和广泛性。数据集不仅提供了对四种顶级图像生成模型的比较，还通过成对比较和内置的质量控制机制，确保了数据的严谨性。此外，数据集还包含了注释者的年龄、性别和地理位置等详细人口统计信息，为跨文化美学偏好的研究提供了宝贵资源。

使用方法

Flux_SD3_MJ_Dalle_Human_Preference_Dataset可用于训练和微调图像生成模型，理解全球对AI生成图像的偏好，开发更好的生成模型评估指标，以及研究跨文化美学偏好。研究人员可以通过该数据集进行新图像生成模型的基准测试，或用于探索不同文化背景下的审美差异。数据集的使用需遵循CDLA-Permissive 2.0许可，并在研究中引用相关文献以尊重数据贡献者的工作。

背景与挑战

背景概述

Flux_SD3_MJ_Dalle_Human_Preference_Dataset是由Rapidata公司于2024年创建的一个大规模人类偏好数据集，专注于文本到图像生成模型的评估。该数据集由Dimitrios Christodoulou和Mads Kuhlmann-Jørgensen等研究人员主导，旨在通过人类投票的方式比较不同AI模型生成的图像质量。数据集包含了超过70万条人类偏好投票，涵盖了Flux.1、DALL-E 3、MidJourney和Stable Diffusion等四种领先的图像生成模型。通过全球144,292名参与者来自145个国家的反馈，该数据集为理解全球范围内对AI生成图像的偏好提供了宝贵资源。其核心研究问题在于如何通过人类主观评价来优化和评估生成模型的性能，推动了生成式AI模型在图像生成领域的进一步发展。

当前挑战

Flux_SD3_MJ_Dalle_Human_Preference_Dataset在构建和应用过程中面临多重挑战。首先，如何确保人类投票的客观性和一致性是一个关键问题，尤其是在跨文化和跨地域的背景下，不同人群的审美偏好可能存在显著差异。其次，数据集的规模庞大，涉及数百万条投票记录，如何在短时间内高效收集和处理这些数据成为技术上的难题。Rapidata通过其创新的标注平台在48小时内完成了数据收集，但如何保证数据质量并避免偏差仍需进一步优化。此外，该数据集的应用场景广泛，包括模型训练、评估和跨文化研究，如何在不同任务中有效利用这些数据也是一个重要的研究方向。

常用场景

经典使用场景

Flux_SD3_MJ_Dalle_Human_Preference_Dataset在文本到图像生成模型的评估与优化中具有重要应用。通过大规模的人类偏好投票数据，研究人员能够深入分析不同模型生成的图像在美学、真实感和创意方面的表现。该数据集为模型之间的比较提供了坚实的基础，帮助开发者在模型训练和微调过程中做出更明智的决策。

衍生相关工作

该数据集衍生了一系列关于生成式人工智能模型评估的经典研究。例如，基于该数据集的研究工作提出了新的评估指标，用于衡量图像生成模型的美学质量和用户满意度。此外，相关研究还探讨了跨文化审美差异对模型输出的影响，为全球化背景下的AI模型开发提供了重要参考。

数据集最近研究