five

BVI-Lowlight|低光视频增强数据集|深度学习数据集

收藏
arXiv2024-02-03 更新2024-07-17 收录
低光视频增强
深度学习
下载链接:
https://ieee-dataport.org/open-access/bvi-lowlight-fully-registered-datasets-low-light-image-and-video-enhancement
下载链接
链接失效反馈
资源简介:
BVI-Lowlight是由布里斯托大学视觉信息实验室创建的一个新型低光视频数据集,包含40个场景,涵盖多种运动情景和两种不同的低光照明条件。该数据集通过使用可编程电动滑轨捕捉正常光照下的地面实况数据,并通过基于图像的后处理进行细化,确保不同光照级别帧之间的像素级对齐。数据集不仅支持监督学习,还适用于全参考质量评估。其应用领域主要集中在解决低光视频增强问题,特别是在深度学习方法的背景下。
提供机构:
布里斯托大学视觉信息实验室
创建时间:
2024-02-03
AI搜集汇总
数据集介绍
main_image_url
构建方式
BVI-Lowlight数据集的构建旨在解决低光条件下图像去噪算法训练数据不足的问题。该数据集通过使用两台相机(Nikon D7000和Sony A7SII)在不同ISO设置下拍摄20个场景,共采集了31800张14位图像,分辨率分别为4256 × 2848和4948 × 3280。为了确保光照环境的稳定性,使用了非闪烁的LED灯,并保持固定的亮度和色温。每一场景拍摄30张照片,ISO值从100到409600不等,涵盖了广泛的噪声特性。通过一系列后处理步骤,包括暗帧去除、异常点检测、强度对齐和亚像素注册,生成了伪真实图像(pseudo groundtruth),以供训练和评估去噪算法。
特点
BVI-Lowlight数据集的主要特点在于其广泛的光照条件和噪声特性,涵盖了从低ISO到高ISO的多种场景,能够有效模拟真实低光环境下的图像噪声。数据集中的图像具有高分辨率和14位深度,提供了丰富的纹理和颜色信息。此外,数据集通过生成伪真实图像,克服了低光条件下获取高质量真实图像的困难,为监督学习提供了可靠的训练数据。
使用方法
BVI-Lowlight数据集可用于训练和评估低光条件下的图像去噪算法。用户可以通过加载数据集中的图像和伪真实图像,使用深度学习模型进行训练,如DnCNN、UNet、Pix2Pix和RIDNet等。数据集支持多种损失函数的应用,包括传统的ℓ1和ℓ2损失,以及基于持久同调的拓扑损失函数。通过对比不同损失函数的效果,用户可以优化去噪模型的性能,特别是在复杂结构和噪声抑制方面的表现。
背景与挑战
背景概述
在图像去噪领域,低光条件下的图像噪声处理一直是一个具有挑战性的问题。传统的去噪算法通常假设噪声是空间不变的,但在低光环境下,噪声特性复杂且多变,导致去噪效果不佳。为了解决这一问题,Alexandra Malyugina、Nantheera Anantrasirichai和David Bull等研究人员于2022年提出了BVI-Lowlight数据集。该数据集包含了在低光条件下拍摄的31800张14位图像,涵盖了多种ISO设置和场景,旨在为低光图像去噪算法的训练和评估提供一个全面的基准。BVI-Lowlight数据集的引入不仅填补了低光图像去噪领域的数据空白,还为开发新的去噪算法提供了宝贵的资源,特别是通过引入基于持久同调的拓扑损失函数,显著提升了去噪效果。
当前挑战
BVI-Lowlight数据集的构建面临多个挑战。首先,低光条件下图像噪声的复杂性使得获取高质量的地面真实数据变得困难,这限制了监督学习算法的性能。其次,现有的去噪数据集通常缺乏多样性,无法全面反映低光环境下噪声的特性。此外,构建过程中需要处理大量的图像数据,并确保数据的准确性和一致性,这对数据处理和存储提出了较高的要求。最后,基于持久同调的拓扑损失函数的引入虽然提升了去噪效果,但其计算复杂度较高,限制了其在实时应用中的可行性。因此,如何在保证去噪效果的同时提高算法的计算效率,是该数据集面临的主要挑战之一。
常用场景
经典使用场景
BVI-Lowlight数据集主要用于低光条件下图像去噪算法的训练和基准测试。该数据集包含了在不同ISO设置下拍摄的图像,涵盖了广泛的噪声水平,能够有效评估去噪算法在复杂噪声环境中的表现。通过使用该数据集,研究人员可以开发和优化基于深度学习的去噪模型,特别是在低光条件下,这些模型能够更好地保留图像的边缘和纹理信息,从而提升图像质量。
实际应用
BVI-Lowlight数据集在实际应用中具有广泛的应用前景,特别是在需要高质量图像的领域,如计算机视觉、自动驾驶、医学成像和消费级视频处理等。在低光环境下,图像噪声问题尤为突出,传统的去噪方法往往无法有效处理这些复杂的噪声。通过使用该数据集训练的去噪算法,可以显著提升低光图像的质量,从而提高目标检测、图像分类和视频增强等任务的准确性和用户体验。
衍生相关工作
BVI-Lowlight数据集的发布激发了大量相关研究工作,特别是在基于拓扑数据分析(TDA)的去噪算法方面。研究人员基于该数据集提出了新的拓扑损失函数,通过持久同调(persistent homology)来捕捉图像的拓扑特征,从而提升去噪效果。此外,该数据集还推动了深度学习模型在低光图像去噪中的应用,如DnCNN、UNet和Pix2Pix等模型的改进和优化。这些工作不仅提升了去噪算法的性能,还为其他图像处理任务提供了新的思路和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

Obstacle-dataset OD

该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。

github 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

TEDS

TEDS(Tencent Chinese Corpus)是由腾讯公司发布的中文文本数据集,主要用于自然语言处理和文本分类任务。该数据集包含了大量的中文文本数据,涵盖了新闻、社交媒体、论坛等多种来源,适用于训练和评估中文语言模型和文本分类模型。

ai.tencent.com 收录