图像-草图对数据集

Name: 图像-草图对数据集
Creator: 哈佛大学
Published: 2025-05-21 01:11:49
License: 暂无描述

arXiv2025-05-21 更新2025-05-22 收录

下载链接：

http://arxiv.org/abs/2505.14621v1

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集由哈佛大学研究人员创建，用于训练CycleGAN模型，将草图转换为逼真的图像。数据集包含1005张从苏黎世建筑数据库中提取的建筑图像及其对应的草图。草图通过一种称为'Dodging'的图像处理技术从图像中生成。该数据集旨在解决从多个草图重建3D场景的问题，特别是在缺乏实际照片的情况下。

This dataset was created by researchers from Harvard University for training CycleGAN models to convert sketches into photorealistic images. It contains 1005 architectural images extracted from the Zurich Building Database and their corresponding sketches. The sketches are generated from the original images using an image processing technique called 'Dodging'. This dataset is designed to address the challenge of reconstructing 3D scenes from multiple sketches, especially when actual photographic materials are unavailable.

提供机构：

哈佛大学

创建时间：

2025-05-21

搜集汇总

数据集介绍

构建方式

该数据集的构建基于苏黎世建筑图像数据库中的真实建筑图像，通过创新的图像处理技术生成对应的素描图像。具体步骤包括将原始图像转换为灰度图，应用倒置模糊技术生成掩膜，再通过像素强度调整和高通滤波处理，最终生成与真实素描风格高度相似的图像。这一过程确保了图像-素描对的精确对应，为后续的3D重建研究提供了高质量的配对数据。

特点

该数据集的核心特点在于其高质量的图像-素描配对，每对数据均经过严格的风格转换处理，确保素描图像既保留了原始建筑的结构特征，又具备艺术素描的视觉效果。数据集覆盖多样化的建筑风格和视角，为计算机视觉领域的风格迁移和3D重建任务提供了丰富的训练素材。此外，数据集的构建方法具有可扩展性，能够适应不同风格素描的生成需求。

使用方法

该数据集主要用于训练CycleGAN模型，实现从素描到真实图像的风格迁移。研究人员可首先利用该数据集训练模型学习素描与真实图像间的映射关系，进而应用于3D重建任务。具体使用时，建议将数据集划分为训练集和测试集，并采用适当的图像增强技术以提高模型的泛化能力。此外，该数据集还可用于评估不同深度估计算法在素描生成图像上的性能表现。

背景与挑战

背景概述

图像-草图对数据集由哈佛大学的研究人员Abhimanyu Talwar和Julien Laasri于2018年创建，旨在解决从多视角草图重建3D场景的计算机视觉问题。该数据集的核心研究问题包括草图拼接、草图到真实图像的转换以及从2D图像推断深度。数据集中的图像来源于Zurich Building Database，而草图则由研究人员通过图像处理技术生成。这一数据集的建立为3D场景重建领域提供了重要的数据支持，尤其在处理历史建筑草图或无摄影记录的场景时具有独特价值。

当前挑战

该数据集面临的主要挑战包括：1) 领域问题方面，草图拼接在真实场景中的泛化能力不足，尤其是当草图风格差异较大时，特征匹配效果显著下降；2) 构建过程中，如何生成多样化的草图风格以增强CycleGAN的鲁棒性是一大难点，同时保持草图与原始图像的结构一致性也需要精细的图像处理技术。此外，从单张草图准确推断深度信息仍存在精度不足的问题，这限制了3D重建的质量。

常用场景

经典使用场景

在计算机视觉领域，图像-草图对数据集为研究者提供了一个独特的平台，用于探索从二维草图到三维场景重建的复杂过程。该数据集通过结合Zurich建筑数据库中的真实图像与人工生成的草图，为训练CycleGAN等生成对抗网络提供了关键数据支持。其经典应用场景包括多视角草图拼接、风格迁移以及单幅草图的深度估计，这些技术在数字文化遗产保护、虚拟场景重建等领域展现出重要价值。

实际应用

在实际应用中，该数据集支撑的技术已用于历史建筑数字化保护，例如重建狄更斯时代伦敦街区的三维模型。教育领域可利用其实现艺术创作到立体模型的快速转换，辅助空间认知教学。娱乐产业则将其应用于游戏场景生成，通过概念草图直接生成可交互的虚拟环境。这些应用显著降低了三维内容创作的门槛，实现了艺术表达与技术呈现的无缝衔接。

衍生相关工作

基于该数据集衍生的经典工作包括改进的跨模态生成网络Sketch2Photo、结合语义分割的层次化重建框架Sketch3D等。相关研究进一步拓展了数据应用边界，如MIT提出的SketchGraph系统将建筑草图转化为参数化BIM模型。这些工作共同推动了计算机视觉与计算机图形学的交叉融合，形成了以草图理解为核心的系列研究成果。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集