five

DREAMBENCH++|个性化图像生成数据集|数据集评估数据集

收藏
arXiv2024-06-25 更新2024-06-26 收录
个性化图像生成
数据集评估
下载链接:
https://dreambenchplus.github.io/
下载链接
链接失效反馈
资源简介:
DREAMBENCH++是由清华大学等机构合作创建的一个大规模个性化图像生成数据集。该数据集包含150张图像和1350个提示,旨在通过多样化的图像和提示来评估个性化图像生成模型的性能。数据集的创建过程涉及从网络收集图像,并通过模型和人工评估进行筛选,以确保图像质量。DREAMBENCH++的应用领域主要集中在个性化图像生成的评估和改进,特别是在解决图像与文本提示的一致性和概念保留的问题上。
提供机构:
清华大学
创建时间:
2024-06-25
AI搜集汇总
数据集介绍
main_image_url
构建方式
DREAMBENCH++ 数据集的构建主要分为两个部分: prompts 和数据。首先,利用 GPT-4o 生成关键词,并从 Unsplash、Rawpixel 和 Google Image Search 等网站收集相应的图像。然后,通过 SAM 模型和人工评估的方式过滤掉低质量的图像,并将剩余的高质量图像输入到 GPT-4o 中生成文本 prompts。这些 prompts 被设计为覆盖不同的难度级别,包括简单的、具有风格变换的和富有想象力的 prompts。最终,DREAMBENCH++ 数据集包含了 150 张高质量的图像和 1350 个 prompts。
特点
DREAMBENCH++ 数据集的主要特点包括:1. 人机对齐:通过使用先进的 GPT-4o 多模态模型进行自动评估,DREAMBENCH++ 的评估结果与人类评估结果高度一致,这在概念保存和提示跟随能力方面分别达到了 79.64% 和 93.18% 的符合度。2. 自动化:DREAMBENCH++ 实现了自动化的评估过程,避免了人工评估的标准化和成本问题。3. 多样性:DREAMBENCH++ 收集了大量多样化的图像,覆盖了从动物和风格到更具挑战性的人类主题、物体和非自然图像风格等各种难度类别。
使用方法
DREAMBENCH++ 数据集的使用方法主要包括:1. 自动评估:利用 GPT-4o 模型对生成的图像进行评估,评估结果与人类评估结果高度一致。2. 人机对齐评估:将 DREAMBENCH++ 的评估结果与人类评估结果进行对比,以验证 DREAMBENCH++ 的评估结果的准确性和可靠性。3. 模型比较:利用 DREAMBENCH++ 数据集对不同的个性化图像生成模型进行评估和比较,以了解不同模型的优缺点和适用场景。
背景与挑战
背景概述
个性化图像生成技术在艺术创作、产品设计等领域具有广泛的应用前景,其核心功能在于根据文本提示或参考图像生成个性化的内容。然而,现有的图像生成评价标准往往与人类感知存在偏差,且依赖于人工评价,耗时且成本高昂。为了解决这一问题,清华大学、西安交通大学等机构的研究人员于2024年提出了DREAMBENCH++数据集。该数据集通过利用先进的跨模态GPT模型进行自动化评价,以实现与人类感知的准确对齐。DREAMBENCH++数据集的构建旨在全面评估个性化图像生成模型的性能,包括图像与文本的一致性以及图像与图像的一致性。通过对7种现代生成模型的基准测试,DREAMBENCH++数据集展示了与人类评价结果的高度一致性,为相关研究提供了创新性的发现。
当前挑战
DREAMBENCH++数据集面临的主要挑战包括:1) 自动化评价与人类感知的对齐。尽管DREAMBENCH++数据集通过使用跨模态GPT模型实现了自动化评价,但在概念保持和文本提示遵循能力方面仍存在一定的偏差。2) 数据集的多样性和复杂性。尽管DREAMBENCH++数据集包含了150张高质量图像和1350个文本提示,但仍然存在一定的局限性。例如,对于人类图像的生成,由于面部细节的敏感性,现有的个性化图像生成模型仍然存在一定的挑战。3) 评价方法的改进。尽管DREAMBENCH++数据集使用跨模态GPT模型进行评价,但仍然存在一定的局限性。例如,对于复杂文本提示的生成,现有的评价方法可能无法准确地捕捉到人类的感知。因此,需要进一步改进评价方法,以提高其准确性和可靠性。
常用场景
经典使用场景
DREAMBENCH++数据集作为个性化图像生成的评估标准,广泛用于衡量现代生成模型在遵循文本提示(图像与提示一致性)和概念保留(图像与图像一致性)方面的能力。该数据集通过使用先进的GPT模型,如GPT-4o,实现了自动化的评价,这些评价与人类的评价高度一致。DREAMBENCH++数据集不仅包含了多样化的图像,还涵盖了各种难度级别的文本提示,从而为个性化图像生成模型的评估提供了全面的基准。
实际应用
DREAMBENCH++数据集在实际应用中具有重要意义。它可以帮助研究人员更好地理解个性化图像生成模型的能力,并推动该领域的技术发展。此外,DREAMBENCH++数据集还可以用于训练和优化个性化图像生成模型,从而提高模型的性能和实用性。例如,通过在DREAMBENCH++数据集上进行训练,模型可以更好地理解人类对图像的偏好,并生成更符合人类期望的图像。
衍生相关工作
DREAMBENCH++数据集的提出和相关研究为个性化图像生成领域的进一步发展奠定了基础。基于DREAMBENCH++数据集的评估结果,研究人员可以更好地理解个性化图像生成模型的能力和局限性,并探索更有效的技术路线。此外,DREAMBENCH++数据集的设计和构建方法也为其他领域的评估和基准构建提供了借鉴和启示。例如,在文本生成、视频生成等领域,可以借鉴DREAMBENCH++数据集的设计思路,构建更加全面和客观的评估标准。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

China Groundgroundwater Monitoring Network

该数据集包含中国地下水监测网络的数据,涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标(如pH值、溶解氧、总硬度等)以及环境因素(如气温、降水量等)。

www.ngac.org.cn 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

LSUI (Large Scale Underwater Image Dataset)

We released a large-scale underwater image (LSUI) dataset including 5004 image pairs, which involve richer underwater scenes (lighting conditions, water types and target categories) and better visual quality reference images than the existing ones.

Papers with Code 收录

FROM-GLC全球30米地表覆盖数据集(2017)

该数据集中的数据获取自清华大学宫鹏团队。全球土地覆盖数据是了解人类活动与全球变化之间复杂互动关系的关键信息来源。FROM-GLC(更精细的全球土地覆盖观测和监测)是利用大地卫星专题成像仪(TM)和增强型专题成像仪(ETM+)数据制作的第一个30米分辨率的全球土地覆盖图。

国家对地观测科学数据中心 收录