five

layoutbench

收藏
Hugging Face2024-07-27 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/j-min/layoutbench
下载链接
链接失效反馈
官方服务:
资源简介:
LayoutBench是一个诊断基准数据集,用于评估布局引导图像生成模型在任意、未见过的布局上的表现。该数据集包含8K张图像,每项任务有1K张图像,分为8个任务,涵盖4种空间控制技能(数量、位置、大小、形状),每种技能有两个OOD布局分组。数据集通过保持CLEVR数据集的对象配置,改变空间布局来创建。图像通过Blender模拟器渲染,并获取边界框布局。数据集的目的是测试模型在CLEVR(ID)数据集上训练后,在LayoutBench(OOD)布局上的表现。
创建时间:
2024-07-21
原始信息汇总

LayoutBench 数据集概述

基本信息

  • 许可证: MIT
  • 任务类别: 文本到图像
  • 语言: 英语
  • 配置:
    • 默认配置:
      • number_few: number/images/*_0-2_*.png
      • number_many: number/images/*_11-13_*.png, number/images/*_14-16_*.png
      • position_boundary: position/images/*_position_boundary_*.png
      • position_center: position/images/*_position_center_*.png
      • shape_horizontal: shape/images/*_H2W1_*.png, shape/images/*_H3W1_*.png
      • shape_vertical: shape/images/*_H1W2_*.png, shape/images/*_H1W3_*.png
      • size_tiny: size/images/*size_020_*.png
      • size_large: size/images/*size_090_*.png, size/images/*size_110_*.png, size/images/*size_130_*.png, size/images/*size_150_*.png

数据集描述

  • 数据集名称: LayoutBench
  • 数据集来源: 来自论文《Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image Generation (CVPR 2024 Workshop)》
  • 数据集内容: 包含8K图像,每个任务1K图像,共8个任务
    • number_few
    • number_many
    • position_center
    • position_boundary
    • size_tiny
    • size_large
    • shape_horizontal
    • shape_vertical

数据集创建

  • 创建方法:
    • (1) 为每个技能采样场景,场景由物体及其位置定义
    • (2) 使用Blender模拟器渲染图像并获取边界框布局

技能详情

  • 技能1: Number
    • few: 0∼2个物体
    • many: 11∼16个物体
  • 技能2: Position
    • center: 物体放置在中心
    • boundary: 物体仅放置在边界
  • 技能3: Size
    • tiny: 物体尺寸为2
    • large: 物体尺寸为{9, 11, 13, 15}
  • 技能4: Shape
    • horizontal: 物体宽高比为2:1或3:1
    • vertical: 物体宽高比为1:2或1:3

数据集文件结构

  • 文件结构:
    • scene files: 用于Blender模拟器渲染的场景文件
    • images: 渲染的图像
    • scene files in COCO format: 转换为COCO格式的场景文件
搜集汇总
数据集介绍
main_image_url
构建方式
LayoutBench数据集的构建旨在评估布局引导图像生成模型在未见布局上的表现。该数据集通过保留CLEVR数据集中的对象配置,仅改变空间布局来生成图像。具体步骤包括:首先为每个技能采样场景,定义对象及其位置;随后使用Blender模拟器渲染图像并获取边界框布局。通过这种方式,LayoutBench成功分离了空间控制与其他图像生成因素,如对象多样性。
特点
LayoutBench数据集包含8K图像,涵盖8个任务,每个任务1K图像,涉及数量、位置、大小和形状四个空间控制技能。每个技能包含两个分布外(OOD)布局分割,如数量技能中的少量对象和大量对象分割。数据集通过Blender渲染生成,确保了图像的高质量和一致性,同时提供了详细的场景文件和COCO格式的转换文件,便于后续的模型评估和分析。
使用方法
使用LayoutBench数据集时,首先需在CLEVR数据集上训练布局引导图像生成模型,随后在LayoutBench的主要分割上进行评估,涵盖4个技能和8个任务。评估过程包括生成图像、检测生成图像中的对象,并计算布局准确率。此外,数据集还提供了细粒度评估分割,允许对每个技能进行更深入的分析。通过这种方式,LayoutBench为布局引导图像生成模型的性能评估提供了全面且细致的基准。
背景与挑战
背景概述
LayoutBench数据集由Jaemin Cho等研究人员于2024年发布,旨在为布局引导的图像生成模型提供一个诊断基准。该数据集基于CLEVR数据集构建,专注于评估模型在处理未见过的布局时的表现。LayoutBench包含8,000张图像,分为8个任务,每个任务涉及不同的空间控制技能,如物体数量、位置、大小和形状。该数据集的发布为图像生成领域的研究提供了新的评估工具,推动了布局控制技术在生成模型中的应用。
当前挑战
LayoutBench数据集面临的挑战主要包括两个方面。首先,该数据集旨在解决布局引导图像生成模型在处理分布外(OOD)布局时的泛化能力问题,这要求模型能够在不熟悉的布局配置下生成合理的图像。其次,在数据集的构建过程中,研究人员需要确保生成的图像能够准确反映不同的空间控制技能,如物体数量、位置、大小和形状的变化。此外,使用Blender模拟器进行图像渲染时,如何保持物体配置的多样性和一致性也是一个技术难点。这些挑战共同构成了LayoutBench数据集的核心研究问题。
常用场景
经典使用场景
LayoutBench数据集在布局引导的图像生成领域具有重要的应用价值。该数据集通过提供多种空间布局任务,如对象数量、位置、大小和形状的变化,为研究人员提供了一个全面的评估平台。经典的使用场景包括在CLEVR数据集上训练的模型在LayoutBench上进行跨分布(OOD)布局的评估,以测试模型在未见过的布局上的生成能力。
解决学术问题
LayoutBench解决了布局引导图像生成模型在跨分布布局上的泛化能力问题。通过提供多样化的布局任务,该数据集帮助研究人员深入理解模型在处理不同空间布局时的表现,尤其是在对象数量、位置、大小和形状等关键因素上的控制能力。这一研究对于提升图像生成模型的鲁棒性和适应性具有重要意义。
衍生相关工作
LayoutBench的发布推动了布局引导图像生成领域的多项经典工作。例如,基于该数据集的研究成果已在CVPR 2024 Workshop上发表,相关论文《Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image Generation》详细探讨了模型在跨分布布局上的表现。此外,LayoutBench-COCO数据集的推出为零样本评估提供了新的基准,进一步扩展了该领域的研究范围。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作