A Dataset of Multi-Illumination Images in the Wild

Name: A Dataset of Multi-Illumination Images in the Wild
Creator: 麻省理工学院计算机科学与人工智能实验室
Published: 2019-10-18 03:49:11
License: 暂无描述

arXiv2019-10-18 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/1910.08131v1

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集名为'A Dataset of Multi-Illumination Images in the Wild'，由麻省理工学院计算机科学与人工智能实验室创建。包含超过1000个真实场景，每个场景在25种不同光照条件下拍摄，总计25000张高动态范围和高分辨率图像。数据集旨在捕捉日常物体在实际环境中的多样性和复杂性，通过使用间接照明和电子闪光灯控制光照方向，实现快速自动捕捉。该数据集适用于训练解决光照和材料理解等逆问题的神经网络，如单图像光照估计、图像重照明和混合光源白平衡。

This dataset, titled 'A Dataset of Multi-Illumination Images in the Wild', was developed by the Computer Science and Artificial Intelligence Laboratory (CSAIL) at the Massachusetts Institute of Technology (MIT). It includes over 1,000 real-world scenes, with each scene captured under 25 distinct illumination conditions, totaling 25,000 high-dynamic-range (HDR) and high-resolution images. This dataset aims to capture the diversity and complexity of everyday objects in real-world environments, and enables fast automatic data acquisition by utilizing indirect lighting and electronic flash to precisely control lighting directions. It is suitable for training neural networks to solve inverse problems related to illumination and material understanding, such as single-image illumination estimation, image relighting, and mixed-light white balance.

提供机构：

麻省理工学院计算机科学与人工智能实验室

创建时间：

2019-10-18

搜集汇总

数据集介绍

构建方式

该数据集基于一种创新的间接反射闪光采集方法构建，通过将电子闪光灯安装在伺服电机上，自动旋转灯头指向墙壁或天花板，利用反射光形成虚拟光源，从而在不移动物理灯具的情况下实现多方向照明。采集设备包括一台索尼α6500无反相机和一支索尼HVL-F60M外置闪光灯，由笔记本电脑控制自动完成拍摄序列。每个场景在25个预设的照明方向下，以3张不同曝光的包围式图像捕获高动态范围影像，并额外记录一张无闪光的纯环境光图像。整个采集过程约需5分钟，共收集了1016个室内场景，覆盖95个不同房间，总计25,000张HDR图像。每张图像还包含由众包标注的密集材质分割掩码，以及用于记录入射照明的镀铬球和灰色球探针。

使用方法

该数据集适用于多种基于学习的视觉任务，典型使用方法包括：首先，将输入图像归一化至灰色球参考点的曝光和白平衡，并在训练和测试时用黑色方块掩码掉镀铬球和灰色球区域，以防止网络直接利用探针信息。对于单图像光照估计，可从数据集中裁剪256×256图像块，训练卷积网络预测16×16的RGB环境贴图，并与真实探针计算L2损失。对于图像重光照，采用基于U-net的图像到图像翻译模型，将左侧光照图像映射为右侧光照图像，并使用梯度域L1损失保持细节。对于混合照明白平衡，通过线性组合不同光照方向的图像生成训练对，随机采样颜色增益和曝光增益，训练U-net预测校正后的色度分量。所有模型均可在标准卷积架构上从头训练，数据集官方提供了训练代码和预训练模型。

背景与挑战

背景概述

在计算机视觉领域，光照与材质之间的复杂交互是理解物体外观的核心，然而传统数据集多局限于单光照条件下的二维图像，难以捕捉光照变化对场景外观的影响。为解决这一局限性，麻省理工学院计算机科学与人工智能实验室（MIT CSAIL）与Adobe研究院的研究人员Lukas Murmann、Michael Gharbi、Miika Aittala和Frédo Durand于2019年发布了“A Dataset of Multi-Illumination Images in the Wild”数据集。该数据集包含超过1000个真实室内场景，每个场景在高动态范围和高分辨率下采集了25种不同光照条件，总计25000张图像。研究团队设计了一种便携式自动捕获装置，通过伺服电机控制闪光灯方向，利用间接反射照明实现多方向光照采样，并同步采集了材质分割标签和光探针作为真值。该数据集旨在填补多光照条件下真实场景数据的空白，为光照估计、图像重照明和混合光源白平衡等逆渲染任务提供了丰富的训练资源，推动了相关领域从实验室受控环境向真实世界场景的拓展。

当前挑战

该数据集所解决的领域问题主要体现在光照相关逆问题的严重不适定性：传统单光照数据集无法提供足够的监督信号，使得光照估计、重照明和材质理解等任务难以从单一图像中准确求解。例如，在单图像重照明中，高光反射、自阴影和相互反射等复杂光照现象对算法构成了显著挑战；在混合光源白平衡中，不同色温光源的混合导致颜色偏移难以校正。在构建过程中，研究团队面临多重挑战：首要难题是设计便携式设备以在真实环境中快速采集多光照图像，他们通过间接反射闪光的创新方案解决了这一问题，但该方案依赖房间几何结构和墙面材质，限制了在户外或大型空间中的应用。此外，捕获过程要求场景在数分钟内保持静态，排除了动态物体和人像的采集；25种光照方向对漫反射材质足够，但对高镜面材质存在欠采样问题。后处理阶段中，通过众包获取稠密材质标签也面临标注质量和一致性的挑战。

常用场景

经典使用场景

在计算机视觉领域，光照与材质理解一直是极具挑战性的逆问题。该数据集提供了超过1000个真实室内场景、每个场景在25种不同光照条件下的高动态范围图像，为研究者提供了前所未有的多光照数据资源。其最经典的使用场景是作为训练和评估单图像光照估计、图像重光照以及混合光源白平衡等任务的基础数据集。通过在该数据集上训练端到端的卷积神经网络，模型能够从单张输入图像中准确预测环境光照分布，或实现从一种光照方向到另一种光照方向的逼真重光照，从而突破传统方法对多光源采集设备的依赖。

解决学术问题

该数据集解决了长期困扰学术界的几个核心问题：首先，它弥补了多光照数据集在真实场景中的匮乏，此前的大部分数据要么在受控实验室环境中采集（如光舞台），要么仅包含单光照图像，无法提供光照变化所需的监督信号。其次，它使得单图像光照估计这一病态问题得以在真实数据上训练，模型能够从漫反射和镜面反射物体中推断主光源方向，显著优于此前基于全景图检测的方法。此外，数据集还推动了混合光源白平衡的研究，通过线性组合不同光照条件模拟多色温场景，训练网络去除不一致色偏，解决了传统白平衡算法无法处理多光源的局限性。这些突破为逆渲染、增强现实等方向奠定了数据基础。

实际应用

该数据集的实际应用价值体现在多个前沿技术领域。在增强现实和混合现实中，利用训练好的光照估计模型，开发者可以将虚拟物体无缝合成到真实场景中，虚拟物体的阴影和高光与真实光照方向一致，显著提升沉浸感。在数字摄影和影视后期制作中，单图像重光照技术允许用户调整照片的光照方向，无需重新拍摄，为图像编辑提供了极大灵活性。此外，混合光源白平衡功能可自动校正由窗边日光与室内灯光混合导致的色偏，广泛应用于智能手机拍照和图像处理软件中，提升成片质量。这些应用均得益于数据集对真实室内场景多样性和复杂性的真实刻画。

数据集最近研究