five

补充的light field datasets

收藏
arXiv2021-07-24 更新2024-07-30 收录
下载链接:
https://github.com/kerenfu/LFSOD-Survey
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集补充了焦点堆栈、深度图和多视角图像,用于统一和完善现有的光场显著性对象检测数据集,使其更加一致和可用。

This dataset augments existing light field saliency object detection datasets with focus stacks, depth maps and multi-view images, aiming to unify and refine them to be more consistent and usable.
创建时间:
2020-10-10
原始信息汇总

数据集概述

数据集内容

光场数据

  • 多视图图像和焦堆栈:包含Lytro Illum相机的多视图图像和焦堆栈的GIF动画。

光场显著物体检测(LFSOD)

  • 传统模型:提供了13种传统LFSOD模型的详细信息,包括模型名称、发表年份、出版物、标题和链接。
  • 基于深度学习的模型:提供了29种基于深度学习的LFSOD模型的详细信息,包括模型名称、发表年份、出版物、标题和链接。
  • 其他相关综述工作:提供了2种与LFSOD相关的综述和调查的详细信息。

光场SOD数据集

  • 数据集概览:提供了8个光场SOD数据集的详细信息,包括数据集名称、发表年份、出版物、大小、多对象比例、数据形式(如焦堆栈、多视图图像、深度图等)和下载链接。

基准测试结果

  • RGB-D SOD模型在我们的测试中:提供了7种RGB-D SOD模型的详细信息,包括模型名称、发表年份、出版物、标题和链接。

数据集更新记录

  • 2020/12/6:发布光场数据集信息。
  • 2021/1/23:发布评估表中所有模型的显著图。
  • 2021/3/6:新增光场数据集和光场显著物体检测工作。
  • 2021/7/22:更新讨论和开放方向部分,更新显著结果,新增传统模型和基于深度学习的模型进行比较。
  • 2021/8/6:新增光场显著物体检测工作。
  • 2022/3/22:新增多个光场显著物体检测工作和数据集。
  • 2023/6/1:新增多个光场显著物体检测工作。

数据集引用

  • 引用信息:提供了数据集的引用信息,具体内容未在提供的文本中展示。
搜集汇总
数据集介绍
main_image_url
构建方式
鉴于现有光场显著性目标检测数据集在数据形式上存在不一致性,例如部分数据集缺失焦点堆栈、深度图或多视角图像,本研究对既有数据集进行了系统性补充与统一化处理。具体而言,对于Lytro Illum数据集,利用其原始光场数据,通过Lytro Desktop软件生成焦点堆栈(含全聚焦图像)与深度图,并依据场景焦点范围等间距采样,去除全模糊或重复切片,最终每场景生成2至16张焦点切片。同时,从微透镜图像阵列中采样生成多视角图像。对于LFSD数据集,同样基于原始数据补全了多视角图像与微透镜图像阵列。对于HFUT-Lytro数据集,则通过逆向操作合成了微透镜图像阵列。这一过程使得所有数据集均统一提供焦点堆栈、深度图、多视角图像及微透镜图像阵列,为全面基准测试奠定了基础。
特点
该补充数据集的核心特点在于其全面性与统一性。通过为LFSD、HFUT-Lytro、Lytro Illum等数据集补全缺失的数据形式,成功构建了一个包含焦点堆栈、深度图、多视角图像及微透镜图像阵列的完整数据体系。这一举措有效解决了此前因数据形式不统一而导致的模型评估困难,使得基于不同输入形式(如焦点堆栈或多视角图像)的显著性检测模型均能在同一数据集上进行公平比较。此外,补充后的数据集在规模上虽仍显有限(如Lytro Illum包含640个场景),但其数据形式的完备性显著提升了作为基准测试的实用价值,为后续研究提供了标准化的评估平台。
使用方法
该补充数据集的使用方式灵活多样,旨在支持各类光场显著性目标检测模型的训练与评估。研究者可根据模型输入需求,选择相应的数据形式进行使用。例如,基于焦点堆栈的模型(如MoLF、ERNet)可直接加载生成的焦点堆栈与全聚焦图像;基于多视角图像的模型(如DLSD)则可利用补全的多视角数据。所有补充数据均已公开于项目网站(https://github.com/kerenfu/LFSOD-Survey),便于直接下载与集成。在评估时,建议采用统一的测试协议,如使用DUTLF-FS的官方训练/测试划分(1000/462),或对无官方划分的数据集(如LFSD、HFUT-Lytro)进行全量评估,以确保结果的可比性与可复现性。
背景与挑战
背景概述
光场显著目标检测(Light Field Salient Object Detection)是计算机视觉领域一个新兴且富有潜力的研究方向,旨在利用光场数据所蕴含的丰富场景信息,包括聚焦度、深度及多视角线索,来提升对图像中显著目标的识别与分割能力。相较于传统的基于RGB图像或RGB-D图像的显著目标检测,光场数据能够提供更为全面和完整的自然场景表征,从而在应对复杂背景、低对比度及遮挡等挑战性场景时展现出显著优势。该领域的开创性工作可追溯至2014年Li等人提出的LFS模型及配套的LFSD数据集,随后以四川大学、大连理工大学、南开大学等为代表的国内外研究机构陆续构建了HFUT-Lytro、DUTLF-FS、DUTLF-MV及Lytro Illum等数据集,并提出了十余种传统及深度学习模型。然而,由于光场数据的多模态特性及采集硬件的特殊性,该领域长期缺乏系统性的综述与基准评估,限制了其进一步发展。Fu等人于2021年发表的综述论文首次对光场SOD进行了全面回顾与基准测试,并通过补充缺失的数据形式(如聚焦堆栈、深度图及多视角图像)实现了数据集的统一化,为后续研究奠定了坚实基础。
当前挑战
光场显著目标检测面临多重挑战。首先,现有数据集规模有限且数据形式不统一,例如Lytro Illum缺乏聚焦堆栈,而DUTLF-FS仅提供聚焦堆栈,这使得模型跨数据集评估极为困难,亟需大规模、多模态统一的基准数据集。其次,光场数据的多变量特性导致模型设计复杂,现有深度学习模型多依赖聚焦堆栈作为输入,而对多视角图像和微透镜图像阵列的探索尚不充分,相关模型性能显著低于基于聚焦堆栈的方法。此外,深度图质量参差不齐,从光场中精确估计深度本身即为一项难题,不精确的深度图会直接损害检测精度。在构建过程中,光场数据采集依赖昂贵的专用硬件(如Lytro相机),且原始数据体积庞大(如Lytro Illum的640个光场占用32.8GB),给数据存储、传输与共享带来巨大障碍。同时,现有模型普遍缺乏边缘感知能力,生成的显著图边界粗糙,难以满足像素级分割任务的高精度要求。最后,训练数据的匮乏使得模型泛化能力受限,亟需探索弱监督或半监督学习策略以缓解标注负担。
常用场景
经典使用场景
在计算机视觉领域,光场显著目标检测(SOD)作为一项基础性任务,其核心在于利用光场数据所蕴含的丰富场景信息,如焦点堆栈、深度图、多视角图像及微透镜图像阵列,来精确识别并分割出图像中最引人注目的区域。该数据集为研究者提供了一个统一且完备的基准平台,使得不同模态的光场数据得以被系统性地评估与比较,从而推动了从传统手工特征方法向深度学习模型的范式转变。其经典的使用场景涵盖了对复杂背景、低对比度以及多目标场景下的显著目标检测,为算法性能的全面验证提供了坚实的数据基础。
实际应用
在实际应用层面,该数据集所支撑的光场显著目标检测技术展现出广阔的应用前景。例如,在沉浸式通信技术(如Google Project Starline)中,光场SOD可用于实时三维成像与数据压缩,提升远程交互的真实感与效率。此外,该技术还可赋能自动驾驶中的障碍物感知、智能监控中的异常事件检测、以及增强现实中的场景理解与交互。通过提供高质量的多模态光场数据,该数据集使得算法能够在复杂光照、遮挡和纹理条件下保持鲁棒性,从而推动这些实际系统从实验室走向产业化部署,显著提升用户体验与系统可靠性。
衍生相关工作
基于该数据集,学术界衍生了一系列具有代表性的经典工作,极大地丰富了光场显著目标检测的研究体系。这些工作涵盖了从传统模型(如LFS、DILF、WSC)到深度学习模型(如DLLF、MoLF、ERNet、LFNet、DLSD、MAC)的完整演进路径,其中深度学习模型通过引入注意力机制、知识蒸馏、记忆导向解码器及多任务协作网络等创新架构,显著提升了检测精度。此外,该数据集还促进了光场SOD与RGB-D SOD之间的交叉比较与融合,催生了如JLDCF、SSF、ATSA等RGB-D模型的适应性改进,并启发了对多视角图像与微透镜图像阵列潜力的深入探索,为未来边缘感知、弱监督学习及高分辨率检测等方向的研究奠定了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作