LSFD

Name: LSFD
Creator: 字节跳动与新加坡国立大学
Published: 2022-12-15 17:09:19
License: 暂无描述

arXiv2022-12-15 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2004.08554v3

下载链接

链接失效反馈

官方服务：

资源简介：

LSFD是一个大规模的真实户外场景去雾数据集，由字节跳动与新加坡国立大学合作创建。该数据集包含10000张图像，其中8000张用于训练，2000张用于测试。数据集通过从高清3D电影中选取高质量的真实户外场景帧，并利用立体深度信息渲染雾霾效果而生成。LSFD数据集的特点在于其高度的真实性和多样性，以及高质量的深度信息，这有助于提升去雾算法在真实场景中的性能。数据集主要应用于提升自动驾驶、安全监控等领域的图像去雾技术。

LSFD is a large-scale real-world outdoor scene dehazing dataset co-created by ByteDance and the National University of Singapore. This dataset consists of 10,000 images, with 8000 allocated for training and 2000 for testing. It is generated by selecting high-quality real outdoor scene frames from high-definition 3D films, and rendering synthetic haze effects using stereo depth information. The LSFD dataset features high realism, diversity, and high-quality depth information, which helps improve the performance of dehazing algorithms in real-world scenarios. This dataset is primarily applied to advance image dehazing technologies in fields such as autonomous driving and security monitoring.

提供机构：

字节跳动与新加坡国立大学

创建时间：

2020-04-18

搜集汇总

数据集介绍

构建方式

在图像去雾研究领域，获取真实室外场景的精确深度信息是构建高质量数据集的瓶颈。LSFD数据集创新性地利用高清晰度3D电影作为数据源，通过精心设计的流程构建而成。研究团队从22部采用立体摄像机拍摄的3D电影中，运用场景检测技术分割出独立片段，并借助语义分割筛选出典型的室外场景。针对每个筛选出的立体图像对，采用先进的光流估计算法PWCNet计算水平视差，再通过内容感知的FGI算法上采样获得高分辨率深度图。基于大气散射物理模型，使用随机采样的散射系数和深度感知的高斯平滑处理，为每张清晰背景图像渲染五种不同浓度的雾霾图像，最终形成包含一万张图像的大规模数据集。

使用方法

该数据集为图像去雾算法的训练与评估提供了系统化的基准平台。数据集已明确划分为包含八千张图像的训练集和两千张图像的测试集，每个样本均提供雾霾图像、透射率图、大气光值及对应的清晰背景图像四部分数据。研究人员可直接使用训练集训练基于深度学习的去雾模型，或利用测试集定量评估传统先验方法的性能。数据集的构建方式确保了其与真实室外雾霾场景的高度一致性，因此在该数据集上训练的模型展现出优异的泛化能力，能够有效提升在真实场景及其他高质量去雾数据集上的性能表现。

背景与挑战

背景概述

LSFD（Realistic Large-Scale Fine-Depth Dehazing Dataset）数据集由字节跳动、新加坡国立大学、阿姆斯特丹大学及IDEA等机构的研究人员于近年联合创建，旨在解决计算机视觉领域单幅图像去雾任务中高质量训练数据匮乏的核心问题。该数据集从高清3D电影中提取了2000幅真实户外场景的无雾图像，并基于立体视觉获取的高精度深度图，依据Koschmieder大气散射模型合成了10000幅雾化图像。其核心研究价值在于首次大规模提供了具有物理真实性的户外场景深度信息，显著缩小了合成数据与真实雾天图像之间的域差距，为数据驱动的去雾算法提供了更可靠的训练基准，推动了自动驾驶、安防监控等实际应用场景中视觉系统的鲁棒性发展。

当前挑战

LSFD数据集所针对的图像去雾领域，长期面临合成数据真实性不足的挑战。现有数据集常因使用单目深度估计或室内RGB-D数据，导致渲染的雾效与真实物理规律存在偏差，限制了模型在真实场景中的泛化能力。在构建过程中，研究团队需攻克三大技术难题：其一，从海量3D电影中自动化筛选高质量、多样化的户外场景帧，并排除已有雾效、运动模糊等干扰样本；其二，在相机参数未知且可能存在负视差的情况下，基于光流估计而非传统立体匹配算法，稳定获取高精度、边界清晰的深度图；其三，依据深度信息与大气光物理模型，生成多种雾密度且视觉逼真的合成图像，确保数据集的物理有效性与多样性。

常用场景

经典使用场景

在计算机视觉领域，图像去雾技术致力于恢复受大气悬浮颗粒影响的户外图像清晰度。LSFD数据集凭借其大规模、高分辨率的真实户外场景图像与精确深度信息，成为训练和评估深度学习去雾模型的经典资源。该数据集通过从高清3D电影中提取的立体图像对生成物理真实的雾效，为模型提供了高度逼真的训练样本，显著提升了去雾算法在真实场景中的泛化能力。

解决学术问题

LSFD数据集有效解决了去雾研究领域长期存在的训练数据瓶颈问题。传统合成数据集常因深度信息不准确或场景多样性不足，导致模型在真实户外环境中表现不佳。该数据集通过多视点立体几何获取的高质量深度图，确保了雾效渲染的物理真实性，为监督学习提供了可靠的成对数据。其大规模和多样性特征缓解了模型过拟合，推动了数据驱动方法在复杂真实场景下的性能突破。

实际应用

在实际应用层面，LSFD数据集支撑的去雾技术已广泛应用于自动驾驶、视频监控与遥感图像处理等领域。在自动驾驶系统中，清晰的视觉感知对障碍物检测与路径规划至关重要；该数据集训练出的模型能有效提升雾霾天气下的环境感知可靠性。此外，在安防监控与卫星图像分析中，提升图像可见度有助于增强目标识别与场景理解的准确性，为户外视觉系统的稳健运行提供了关键技术保障。

数据集最近研究