layoutbench

Hugging Face2024-07-27 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/j-min/layoutbench

下载链接

链接失效反馈

官方服务：

资源简介：

LayoutBench是一个诊断基准数据集，用于评估布局引导图像生成模型在任意、未见过的布局上的表现。该数据集包含8K张图像，每项任务有1K张图像，分为8个任务，涵盖4种空间控制技能（数量、位置、大小、形状），每种技能有两个OOD布局分组。数据集通过保持CLEVR数据集的对象配置，改变空间布局来创建。图像通过Blender模拟器渲染，并获取边界框布局。数据集的目的是测试模型在CLEVR（ID）数据集上训练后，在LayoutBench（OOD）布局上的表现。

创建时间：

2024-07-21

原始信息汇总

LayoutBench 数据集概述

基本信息

许可证: MIT
任务类别: 文本到图像
语言: 英语
配置:
- 默认配置:
  - number_few: number/images/*_0-2_*.png
  - number_many: number/images/*_11-13_*.png, number/images/*_14-16_*.png
  - position_boundary: position/images/*_position_boundary_*.png
  - position_center: position/images/*_position_center_*.png
  - shape_horizontal: shape/images/*_H2W1_*.png, shape/images/*_H3W1_*.png
  - shape_vertical: shape/images/*_H1W2_*.png, shape/images/*_H1W3_*.png
  - size_tiny: size/images/*size_020_*.png
  - size_large: size/images/*size_090_*.png, size/images/*size_110_*.png, size/images/*size_130_*.png, size/images/*size_150_*.png

数据集描述

数据集名称: LayoutBench
数据集来源: 来自论文《Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image Generation (CVPR 2024 Workshop)》
数据集内容: 包含8K图像，每个任务1K图像，共8个任务
- number_few
- number_many
- position_center
- position_boundary
- size_tiny
- size_large
- shape_horizontal
- shape_vertical

数据集创建

创建方法:
- (1) 为每个技能采样场景，场景由物体及其位置定义
- (2) 使用Blender模拟器渲染图像并获取边界框布局

技能详情

技能1: Number
- few: 0∼2个物体
- many: 11∼16个物体
技能2: Position
- center: 物体放置在中心
- boundary: 物体仅放置在边界
技能3: Size
- tiny: 物体尺寸为2
- large: 物体尺寸为{9, 11, 13, 15}
技能4: Shape
- horizontal: 物体宽高比为2:1或3:1
- vertical: 物体宽高比为1:2或1:3

数据集文件结构

文件结构:
- scene files: 用于Blender模拟器渲染的场景文件
- images: 渲染的图像
- scene files in COCO format: 转换为COCO格式的场景文件

搜集汇总

数据集介绍

构建方式

LayoutBench数据集的构建旨在评估布局引导图像生成模型在未见布局上的表现。该数据集通过保留CLEVR数据集中的对象配置，仅改变空间布局来生成图像。具体步骤包括：首先为每个技能采样场景，定义对象及其位置；随后使用Blender模拟器渲染图像并获取边界框布局。通过这种方式，LayoutBench成功分离了空间控制与其他图像生成因素，如对象多样性。

特点

LayoutBench数据集包含8K图像，涵盖8个任务，每个任务1K图像，涉及数量、位置、大小和形状四个空间控制技能。每个技能包含两个分布外（OOD）布局分割，如数量技能中的少量对象和大量对象分割。数据集通过Blender渲染生成，确保了图像的高质量和一致性，同时提供了详细的场景文件和COCO格式的转换文件，便于后续的模型评估和分析。

使用方法

使用LayoutBench数据集时，首先需在CLEVR数据集上训练布局引导图像生成模型，随后在LayoutBench的主要分割上进行评估，涵盖4个技能和8个任务。评估过程包括生成图像、检测生成图像中的对象，并计算布局准确率。此外，数据集还提供了细粒度评估分割，允许对每个技能进行更深入的分析。通过这种方式，LayoutBench为布局引导图像生成模型的性能评估提供了全面且细致的基准。

背景与挑战

背景概述

LayoutBench数据集由Jaemin Cho等研究人员于2024年发布，旨在为布局引导的图像生成模型提供一个诊断基准。该数据集基于CLEVR数据集构建，专注于评估模型在处理未见过的布局时的表现。LayoutBench包含8,000张图像，分为8个任务，每个任务涉及不同的空间控制技能，如物体数量、位置、大小和形状。该数据集的发布为图像生成领域的研究提供了新的评估工具，推动了布局控制技术在生成模型中的应用。

当前挑战

LayoutBench数据集面临的挑战主要包括两个方面。首先，该数据集旨在解决布局引导图像生成模型在处理分布外（OOD）布局时的泛化能力问题，这要求模型能够在不熟悉的布局配置下生成合理的图像。其次，在数据集的构建过程中，研究人员需要确保生成的图像能够准确反映不同的空间控制技能，如物体数量、位置、大小和形状的变化。此外，使用Blender模拟器进行图像渲染时，如何保持物体配置的多样性和一致性也是一个技术难点。这些挑战共同构成了LayoutBench数据集的核心研究问题。

常用场景

经典使用场景

LayoutBench数据集在布局引导的图像生成领域具有重要的应用价值。该数据集通过提供多种空间布局任务，如对象数量、位置、大小和形状的变化，为研究人员提供了一个全面的评估平台。经典的使用场景包括在CLEVR数据集上训练的模型在LayoutBench上进行跨分布（OOD）布局的评估，以测试模型在未见过的布局上的生成能力。

解决学术问题

LayoutBench解决了布局引导图像生成模型在跨分布布局上的泛化能力问题。通过提供多样化的布局任务，该数据集帮助研究人员深入理解模型在处理不同空间布局时的表现，尤其是在对象数量、位置、大小和形状等关键因素上的控制能力。这一研究对于提升图像生成模型的鲁棒性和适应性具有重要意义。

衍生相关工作

LayoutBench的发布推动了布局引导图像生成领域的多项经典工作。例如，基于该数据集的研究成果已在CVPR 2024 Workshop上发表，相关论文《Diagnostic Benchmark and Iterative Inpainting for Layout-Guided Image Generation》详细探讨了模型在跨分布布局上的表现。此外，LayoutBench-COCO数据集的推出为零样本评估提供了新的基准，进一步扩展了该领域的研究范围。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集