OverLayBench
收藏arXiv2025-09-24 更新2025-11-21 收录
下载链接:
https://hf-mirror.com/datasets/cywang143/OverLayBench_Eval
下载链接
链接失效反馈官方服务:
资源简介:
OverLayBench是一个用于评估布局到图像生成模型的新基准,它具有高质量的注释和不同难度级别的均衡分布。数据集由大约86,000张图像组成,这些图像由Flux模型根据COCO数据集的描述生成,并经过Qwen模型的进一步注释和人类审查以确保质量。数据集中的每个图像都包含一个全局描述和多个实例级别的描述,以及重叠实例之间的空间和语义关系描述。该数据集旨在解决现有基准在评估具有复杂重叠的布局到图像生成模型方面的局限性。
提供机构:
UC San Diego & Lambda, Inc.
创建时间:
2025-09-24
搜集汇总
数据集介绍

构建方式
在布局到图像生成领域,现有基准普遍偏向简单重叠场景,难以评估模型在复杂空间关系下的表现。OverLayBench通过三阶段流程构建高质量数据集:首先基于真实图像描述生成候选图像,随后利用视觉语言模型提取实例级边界框与语义描述,最后通过人工审核确保空间关系与语义标注的精确性。该流程特别关注边界框重叠区域的实例交互,构建了涵盖简单、常规与复杂层级的平衡数据分布。
使用方法
作为布局到图像生成任务的评估基准,研究者可将模型生成的图像与数据集标注进行多维度比对。通过标准化的交并比计算评估空间对齐精度,利用重叠区域交并比专项衡量遮挡处理能力,结合视觉语言模型自动评估实例生成成功率与关系还原度。该基准支持跨难度层级的渐进式测试,助力模型在复杂空间组合推理方面的能力诊断与优化。
背景与挑战
背景概述
OverLayBench作为布局到图像生成领域的前沿数据集,由加州大学圣地亚哥分校与Lambda公司联合团队于2025年提出,聚焦于解决密集重叠边界框场景下的视觉生成难题。该数据集通过引入量化重叠复杂度的OverLayScore指标,系统性地评估生成模型在空间重叠与语义相似性双重挑战下的表现。其创新性体现在采用Qwen视觉语言模型进行高质量标注,并构建包含2052个简单布局与2000个复杂布局的平衡测试集,为推进可控图像生成技术的鲁棒性奠定了重要基础。
当前挑战
布局到图像生成领域面临的核心挑战在于处理高重叠边界框导致的物体融合与空间模糊问题,具体表现为语义相近物体在重叠区域产生视觉畸变。数据集构建过程中需克服三大难题:首先是通过合成遮挡与真实图像结合的方式构建训练数据时,需保证边界框标注与视觉内容的高度一致性;其次是利用视觉语言模型进行实例关系提取时,需通过人工审核消除描述性幻觉;最后是设计O-mIoU与SRR等新型评估指标时,需精准捕捉重叠区域的生成质量与空间关系还原度。
常用场景
经典使用场景
在可控图像生成领域,OverLayBench作为专为密集重叠布局设计的基准测试工具,其经典应用场景聚焦于评估布局到图像生成模型在复杂空间关系下的表现能力。该数据集通过精心构建的高重叠度边界框布局,系统化检验模型在对象交叠区域的生成质量,特别适用于模拟现实世界中物体相互遮挡的视觉场景,为模型在空间组合推理方面的性能提供标准化测试环境。
解决学术问题
该数据集有效解决了布局到图像生成中长期存在的重叠对象生成难题,针对边界框高度重叠时出现的对象融合、空间模糊和视觉失真等关键问题提供了系统化评估方案。通过引入OverLayScore量化指标,首次将空间重叠度与语义相似性纳入统一评估框架,突破了传统基准在复杂布局评估上的局限性,为研究界提供了识别模型薄弱环节的理论依据和实践工具。
实际应用
在现实应用层面,OverLayBench为需要精确空间控制的图像生成系统提供了重要验证平台,特别是在虚拟场景构建、广告设计自动化、游戏资产生成等领域具有显著价值。其构建的密集重叠场景能够有效测试生成模型在复杂空间约束下的鲁棒性,为开发具有精确对象定位能力的商业级图像生成工具提供了关键技术支持。
数据集最近研究
最新研究方向
在布局到图像生成领域,OverLayBench作为新兴基准,聚焦于解决密集重叠边界框带来的生成挑战。当前研究前沿集中于开发能够处理高空间重叠和语义相似实例的模型,通过引入OverLayScore量化布局复杂度,揭示了现有方法在复杂场景下的生成质量退化问题。热点探索方向包括利用非模态掩码监督增强模型对遮挡关系的理解,如CreatiLayout-AM通过注意力对齐机制提升重叠区域的生成连贯性。这一进展为现实场景中具有强空间约束的图像合成奠定了理论基础,推动了可控生成技术向更高鲁棒性和语义精确性的演进。
相关研究论文
- 1通过UC San Diego & Lambda, Inc. · 2025年
以上内容由遇见数据集搜集并总结生成



