five

UVEB|水下视觉数据集|图像增强数据集

收藏
arXiv2024-04-27 更新2024-06-21 收录
水下视觉
图像增强
下载链接:
https://github.com/yzbouc/UVEB
下载链接
链接失效反馈
资源简介:
UVEB是中国海洋大学电子工程学院创建的首个大规模高分辨率水下视频增强数据集,包含1308对视频序列和453,874对高分辨率帧对,其中38%为超高清4K帧对。数据集来源于全球20多个国家,涵盖多种水下场景和视频退化类型,适应多样复杂的水下环境。创建过程中,通过收集高分辨率视频并提供视频质量评分来构建UVEB。该数据集主要应用于水下视觉领域,旨在解决水下图像增强的问题,通过提供大规模高质量的训练样本来推动水下视觉技术的发展。
提供机构:
中国海洋大学电子工程学院
创建时间:
2024-04-23
AI搜集汇总
数据集介绍
main_image_url
构建方式
UVEB数据集的构建旨在填补水下视频增强领域大规模、高质量数据集的空白。该数据集由来自中国多个海域和港口的高分辨率水下视频组成,并通过网络收集了来自世界各地水下摄影师分享的视频,以确保样本的多样性。为了获得高质量的配对训练样本,研究人员选择了20种不同的水下图像增强方法对原始视频进行处理,并从中选取最佳结果作为地面真实数据(GT)。此外,数据集还包含了2616个由人工标注的原始视频和GT的质量评分,以进一步验证样本的可靠性和多样性。
使用方法
UVEB数据集可用于训练和评估水下视频增强模型。研究人员可以利用数据集中的配对视频序列和帧对来训练深度神经网络,以提高模型在水下图像增强任务上的性能。此外,数据集中的视频质量评分还可以用于评估模型的质量,并帮助研究人员识别和解决模型存在的问题。为了更好地利用数据集,研究人员还可以参考数据集提供的质量评分和注释,设计更加有效的训练和评估策略。
背景与挑战
背景概述
水下视觉领域的发展离不开高质量的数据集,然而,目前缺乏大规模和高品质的配对训练样本成为了水下图像增强(UIE)发展的主要瓶颈。为了解决这一问题,Yaofeng Xie等人构建了首个大规模高分辨率水下视频增强基准(UVEB)。UVEB包含了1308对视频序列和超过453,000个高分辨率帧对,这些数据来自多个国家,涵盖了各种场景和视频退化类型,以适应多样和复杂的水下环境。此外,他们还提出了首个监督水下视频增强方法UVENet,通过充分利用水下视频的冗余退化信息,UVENet能够更好地完成视频增强。
当前挑战
尽管水下图像易于收集,但获得校准的配对水下图像却是一项昂贵且困难的工作。这导致现有的配对真实水下数据集规模相对较小,可能增加学习模型过拟合的风险。因此,对大规模、真实世界的配对训练样本的需求成为了UIE发展的主要瓶颈。水下任务更多地使用视频而不是单个图像,而视频相邻帧的冗余信息可以加速或优化图像增强过程。UVEB数据集的构建旨在解决这一问题,通过收集高分辨率视频和提供额外的视频质量分数,以提高样本的可靠性和多样性。此外,UVENet的设计旨在更有效地利用水下视频的冗余信息,以实现更好的UIE效果,并减少额外的计算成本。
常用场景
经典使用场景
UVEB数据集是首个大规模的高分辨率水下视频增强基准数据集,它包含了1308对视频序列和超过453,000个高分辨率帧对,其中38%是超高清4K帧对。UVEB数据集的构建旨在推动水下视觉技术的发展,它涵盖了来自多个国家的各种场景和视频退化类型,以适应多样和复杂的水下环境。UVEB数据集的构建者还提出了首个监督水下视频增强方法UVENet。UVENet通过将当前帧信息转换为卷积核并将其传递给相邻帧,实现了高效的帧间信息交换。通过充分利用水下视频中的冗余退化信息,UVENet能够更好地完成视频增强任务。实验结果表明,UVENet的网络设计有效且性能良好。
解决学术问题
UVEB数据集解决了水下图像增强(UIE)领域长期存在的难题。现有的UIE方法往往无法完全消除水散射的影响,且难以在各种真实水下场景中广泛应用。UVEB数据集的构建,为深度神经网络提供了大规模的训练数据,有效地解决了UIE方法过拟合的问题。此外,UVEB数据集的多样性也为研究者在不同的水下环境中进行UIE方法的评估和优化提供了可能。
实际应用
UVEB数据集在实际应用中具有广泛的前景。水下图像和视频是海洋观测的重要信息渠道,但由于水体的散射作用,水下图像和视频常常出现颜色偏差和模糊等问题。UVEB数据集的提出,为水下图像和视频的增强提供了有效的解决方案,有助于提高水下观测的准确性和效率。此外,UVEB数据集还可以用于水下机器人、水下目标检测等领域的研发,为水下科学研究和技术应用提供有力支持。
数据集最近研究
最新研究方向
水下视频增强领域的研究前沿主要集中在利用大规模、高质量的配对训练样本,以及充分利用视频帧间冗余信息来提高水下视频质量。UVEB数据集的构建为这一研究方向提供了重要的支持。该数据集包含了1308对视频序列和超过453,000对高分辨率帧,覆盖了多种水下场景和视频退化类型,为水下视觉研究提供了丰富的数据资源。基于UVEB数据集,研究人员提出了UVENet,这是一种新的监督水下视频增强方法,它通过将当前帧信息转换为卷积核,并将其传递到相邻帧,实现了高效的帧间信息交换,从而更好地完成了视频增强任务。实验结果表明,UVENet具有网络设计有效和性能优良的特点。
相关研究论文
  • 1
    UVEB: A Large-scale Benchmark and Baseline Towards Real-World Underwater Video Enhancement中国海洋大学电子工程学院 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录