open-image-preferences-v1
收藏Hugging Face2024-12-09 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/data-is-better-together/open-image-preferences-v1
下载链接
链接失效反馈官方服务:
资源简介:
Open Image Preferences数据集用于文本到图像和图像到文本的任务,包含多个特征和图像相关的特征。其目标是创建10K文本到图像的偏好对,用于评估图像生成模型在不同难度和质量级别的提示下的表现。数据集通过使用来自fal/imgsys-results的提示,并让社区对生成的两张图像进行偏好标注来实现这一目标。
创建时间:
2024-11-25
原始信息汇总
Open Image Preferences
数据集概述
- 名称: Open Image Preferences
- 大小: 1K<n<10K
- 语言: 英语 (en)
- 许可证: Apache 2.0
- 任务类别:
- 文本到图像
- 图像到文本
- 标签:
- preference
- vlm
- flux
- stable-diffusion
- synthetic
- distilabel
数据集结构
- 特征:
quality_prompt: 字符串category: 字符串subcategory: 字符串style_prompt: 字符串simplified_prompt: 字符串__index_level_0__: 整数 (int64)grouped_model_name: 字符串序列prompt: 字符串distilabel_metadata: 结构体raw_input_image_gen_quality_dev: 结构体prompt: 字符串
raw_input_image_gen_quality_sd: 结构体prompt: 字符串
raw_input_image_gen_simplified_dev: 结构体prompt: 字符串
raw_input_image_gen_simplified_sd: 结构体prompt: 字符串
raw_output_image_gen_quality_dev: 结构体image: 字符串
raw_output_image_gen_quality_sd: 结构体image: 字符串
raw_output_image_gen_simplified_dev: 结构体image: 字符串
raw_output_image_gen_simplified_sd: 结构体image: 字符串
image_quality_dev: 图像image_simplified_dev: 图像image_quality_sd: 图像image_simplified_sd: 图像
数据集配置
- 配置名称: default
- 数据文件:
split: cleanedpath: data/cleaned-*
数据集统计
- 分割:
cleaned:num_bytes: 11760355250.5num_examples: 8667
- 下载大小: 11739570585
- 数据集大小: 11760355250.5
数据集目标
- 目标: 创建10K文本到图像的偏好对,用于评估图像生成模型在各种常见图像类别上的性能。
- 方法: 使用fal/imgsys-results中的提示,这些提示基于复杂性和质量进行了进化,并要求社区对每个提示生成的两张图像进行偏好标注。
- 结果: 成功标注了10K偏好对,结果数据集可在此处查看。
搜集汇总
数据集介绍

构建方式
在构建Open Image Preferences v1数据集时,研究者们采用了从fal/imgsys-results数据集中提取的提示语,这些提示语经过精心设计,涵盖了不同复杂度和质量的图像类别。随后,研究者邀请社区成员对根据这些提示生成的两幅图像进行偏好标注,从而形成了10,000对文本到图像的偏好数据。这一过程确保了数据集的多样性和广泛适用性,为图像生成模型的性能评估提供了坚实的基础。
特点
Open Image Preferences v1数据集的显著特点在于其丰富的多样性和高质量的标注。该数据集包含了10,000对文本到图像的偏好标注,涵盖了多种图像类别和风格,能够有效评估不同图像生成模型的表现。此外,数据集中的提示语经过精心设计,具有不同的复杂度和质量水平,使得模型在处理各种任务时都能得到全面的测试。
使用方法
Open Image Preferences v1数据集主要用于评估和优化文本到图像生成模型的性能。研究者可以通过加载该数据集,利用其中的提示语和对应的图像偏好标注,对模型生成的图像进行质量评估。此外,该数据集还可用于训练和微调模型,以提高其在不同图像类别和风格上的生成能力。通过对比不同模型生成的图像,研究者可以更精确地识别和改进模型的弱点。
背景与挑战
背景概述
在图像生成与文本到图像转换领域,Open Image Preferences v1数据集的创建旨在为模型性能评估提供丰富的资源。该数据集由主要研究人员或机构于近期开发,专注于生成10,000对文本到图像的偏好配对,以评估不同图像生成模型在多种常见图像类别中的表现。通过利用来自[fal/imgsys-results](https://huggingface.co/datasets/fal/imgsys-results)的提示,这些提示根据复杂性和质量进行了进化,研究人员随后邀请社区对每个提示生成的两张图像进行偏好标注。这一数据集的构建不仅推动了图像生成技术的进步,还为相关领域的研究提供了宝贵的基准数据。
当前挑战
Open Image Preferences v1数据集的构建面临多项挑战。首先,生成高质量且多样化的图像对需要复杂的提示设计和模型调优,以确保生成的图像在视觉上具有显著差异,从而有效评估模型的性能。其次,社区标注的偏好数据可能受到主观因素的影响,如何确保标注的一致性和可靠性是一个重要问题。此外,数据集的规模和多样性要求在有限的资源下进行高效的数据收集和处理,这对数据管理和计算资源提出了较高的要求。
常用场景
经典使用场景
在图像生成领域,Open Image Preferences v1数据集的经典使用场景主要集中在评估和优化文本到图像生成模型的性能。该数据集通过提供大量的文本提示及其对应的生成图像对,帮助研究者分析模型在不同复杂度和质量要求下的表现。例如,研究者可以利用这些数据对模型进行微调,以提高其在特定风格或类别图像生成中的准确性和用户满意度。
实际应用
在实际应用中,Open Image Preferences v1数据集被广泛用于图像生成模型的训练和验证。例如,在广告设计、游戏开发和虚拟现实等领域,开发者可以利用该数据集优化生成模型,以确保生成的图像更符合用户需求和审美标准。此外,该数据集还可用于个性化内容生成,如为用户定制独特的艺术作品或虚拟场景。
衍生相关工作
基于Open Image Preferences v1数据集,研究者们开展了一系列相关工作。例如,有研究通过分析用户偏好数据,提出了新的图像生成模型架构,以提高生成图像的质量和多样性。此外,还有工作利用该数据集进行跨模态学习,探索文本与图像之间的深层关联,进一步提升了文本到图像生成任务的效果。这些衍生工作不仅丰富了图像生成领域的研究内容,也为实际应用提供了更多可能性。
以上内容由遇见数据集搜集并总结生成



