UrbanSyn

Name: UrbanSyn
Creator: 计算机视觉中心(CVC)
Published: 2023-12-19 22:09:12
License: 暂无描述

arXiv2023-12-19 更新2024-07-24 收录

下载链接：

https://www.urbansyn.org/

下载链接

链接失效反馈

官方服务：

资源简介：

UrbanSyn数据集由计算机视觉中心(CVC)开发，是一个高度真实的合成城市驾驶场景数据集，包含7539张图像。该数据集通过半程序化生成，旨在模拟真实世界的复杂性和多样性，提供包括像素级深度、语义分割、实例分割以及物体边界框和遮挡程度在内的详细标签。UrbanSyn数据集的设计考虑了道路布局、背景内容和交通参与者的多样性，旨在解决自动驾驶领域中的视觉任务，如语义分割、实例分割和深度估计。通过与GTAV和Synscapes数据集结合，UrbanSyn有助于减少合成数据与真实数据之间的域差异，推动无监督域适应技术的发展。

The UrbanSyn dataset, developed by the Computer Vision Center (CVC), is a highly realistic synthetic urban driving scene dataset consisting of 7539 images. Generated semi-procedurally, it aims to simulate the complexity and diversity of real-world scenarios, and provides detailed annotations including pixel-level depth, semantic segmentation, instance segmentation, object bounding boxes, and occlusion degrees. The design of UrbanSyn takes into account the diversity of road layouts, background content and traffic participants, targeting visual tasks in the autonomous driving domain such as semantic segmentation, instance segmentation and depth estimation. When combined with the GTAV and Synscapes datasets, UrbanSyn helps reduce the domain gap between synthetic data and real-world data, advancing the development of unsupervised domain adaptation techniques.

提供机构：

计算机视觉中心(CVC)

创建时间：

2023-12-19

搜集汇总

数据集介绍

构建方式

在自动驾驶视觉感知领域，合成数据集的构建正逐步迈向高真实感与可控性的融合。UrbanSyn数据集采用半程序化生成技术，其构建流程始于从OpenStreetMap等地理信息系统获取真实道路布局，随后通过Mathworks RoadRunner进行道路、车道及人行道的精确建模。在Unity引擎中，利用参数化脚本解析场景布局并实例化三维资产，结合SideFX Houdini生成程序化变体以增强几何与材质的多样性。最终，采用OctaneRender实现的无偏路径追踪渲染技术，配合自适应采样与深度学习降噪，在保证高真实感的同时显著提升渲染效率，生成包含深度、语义分割、实例分割及带遮挡度标注的边界框等多模态真值数据。

特点

UrbanSyn数据集的核心特征体现在其高度的真实感与精心设计的多样性。相较于基于游戏引擎的GTAV数据集，UrbanSyn采用电影级路径追踪渲染，模拟了大气参与介质等复杂光学效应，并引入程序化生成的建筑与随机化材质以刻画真实世界的不完美性。与Synscapes数据集相比，UrbanSyn并未特定模仿某一真实数据集，而是通过融合高质量三维资产与半程序化生成，在紧凑的7,539张图像中最大化场景布局、背景内容与交通参与者的多样性。其标注体系严格遵循Cityscapes的19类语义标准，并提供像素级实例分割、深度图及带遮挡比例的二维边界框，为多任务学习提供了坚实基础。

使用方法

UrbanSyn数据集主要用于自动驾驶场景下的合成到真实无监督域适应研究，尤其在语义分割任务中展现出显著价值。研究者可将其作为独立的合成源域，或与GTAV、Synscapes共同构成“三剑客”多源数据集，以增强模型对真实世界变化的泛化能力。典型使用流程包括：首先在合成数据上预训练分割模型（如DeepLabV3+或SegFormer），随后通过域适应方法（如HRDA或协同训练）在未标注的真实数据集（如Cityscapes、BDD100K、Mapillary Vistas）上进行自适应。实践表明，引入LAB色彩空间对齐等预处理能有效减小域间差异，而多源联合训练策略可显著提升在复杂真实场景下的分割精度，尤其在细小物体（如交通标志、行人）的识别上表现突出。

背景与挑战

背景概述

在自动驾驶视觉感知领域，合成数据因其能够提供精确、一致的像素级标注而备受关注，但合成数据与真实图像之间的域差异始终是核心挑战。UrbanSyn数据集由西班牙计算机视觉中心（CVC）、加利西亚大学（UDC）及NVIDIA等机构的研究团队于2023年联合创建，旨在通过半程序化生成的高真实感城市驾驶场景图像，为语义分割、实例分割、深度估计等任务提供高质量的合成数据源。该数据集与GTAV、Synscapes共同构成“三剑客”组合，通过多源数据融合策略，显著提升了无监督域适应在语义分割任务上的性能，为缩小合成与真实数据间的域差距提供了新的基准。

当前挑战

UrbanSyn致力于解决合成数据到真实数据域适应的核心挑战，特别是在城市驾驶场景的语义分割任务中，如何有效弥合合成图像与真实图像在纹理、光照、物体分布等方面的视觉差异。在构建过程中，研究团队面临多重技术挑战：首先，需在保证高真实感渲染的同时控制计算成本，为此采用了自适应采样与深度学习去噪技术以平衡渲染质量与效率；其次，需确保场景布局的多样性与真实性，通过整合GIS地图数据与程序化生成技术来模拟不同城市道路结构；此外，还需精心设计资产库与材质系统以模拟真实世界的不完美性，避免合成图像产生“恐怖谷”效应，从而增强模型在复杂真实环境中的泛化能力。

常用场景

经典使用场景

在自动驾驶视觉感知研究中，UrbanSyn数据集常被用于无监督域适应（UDA）任务，特别是在语义分割领域。该数据集通过半程序化生成的合成城市驾驶场景，提供了像素级精确标注，包括深度、语义分割和实例分割信息。研究者通常将UrbanSyn与GTAV、Synscapes数据集结合，形成“三剑客”组合，以增强合成数据源的多样性，从而更有效地弥合合成数据与真实数据之间的域差距。

解决学术问题

UrbanSyn主要解决了合成数据与真实数据之间的域适应问题，显著提升了语义分割模型在真实场景中的泛化能力。通过提供高质量、多样化的合成图像，该数据集帮助研究者构建更强大的基线模型，并在无监督域适应框架下取得了新的性能基准。其意义在于推动了多源合成数据融合的研究范式，为自动驾驶视觉系统的可靠训练提供了关键数据支撑。

衍生相关工作

UrbanSyn的推出催生了一系列相关研究工作，尤其是在多源合成数据融合与无监督域适应领域。基于该数据集，研究者开发了如HRDA和协同训练等先进方法，并在Cityscapes、BDD100K和Mapillary Vistas等真实数据集上取得了新的性能突破。这些工作进一步验证了合成数据多样性对提升模型鲁棒性的重要性，推动了自动驾驶视觉感知技术的持续演进。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集