UVT2000
收藏arXiv2024-06-03 更新2024-06-21 收录
下载链接:
https://github.com/Angknpng/SACNet
下载链接
链接失效反馈官方服务:
资源简介:
UVT2000数据集由安徽大学信息材料与智能感知安徽省重点实验室创建,包含2000对直接从各种真实世界场景中捕获的未对齐的可见光和热图像对。该数据集旨在支持无对齐RGBT显著对象检测的研究,通过提供未经过人工对齐的图像对,反映了实际应用中的对齐问题。创建过程中,图像对未经过任何对齐处理,直接从热红外和CCD摄像机捕获,确保了数据集的自然性和实用性。UVT2000数据集的应用领域包括智能视频监控、遥感图像分析和无人机监控等,旨在解决由于图像对未对齐导致的显著对象检测性能下降的问题。
The UVT2000 dataset was developed by the Anhui Provincial Key Laboratory of Information Materials and Intelligent Sensing, Anhui University. It contains 2000 pairs of unaligned visible and thermal infrared images directly captured from diverse real-world scenarios. This dataset is constructed to support research on unaligned RGBT salient object detection, as it provides unaligned image pairs that reflect the alignment issues prevalent in real-world applications. During its creation, the image pairs were not subjected to any alignment processing and were directly captured using thermal infrared and CCD cameras, ensuring the dataset's naturalness and practicality. The application domains of the UVT2000 dataset include intelligent video surveillance, remote sensing image analysis, unmanned aerial vehicle (UAV) surveillance, and more, with the goal of addressing the performance degradation of salient object detection caused by misaligned image pairs.
提供机构:
安徽大学信息材料与智能感知安徽省重点实验室
创建时间:
2024-06-03
搜集汇总
数据集介绍

构建方式
UVT2000数据集通过真实的相机拍摄,直接收集了2000对未对齐的RGB和热红外图像对,涵盖了各种现实场景,包括低光照、坏天气、多目标等挑战。这些图像对未经过任何人工对齐操作,直接反映了实际应用中的问题。为了确保数据集的质量和可靠性,研究人员首先收集了约2500对图像,然后通过五名标注者进行筛选,最终标注了最高排名的2000对图像。此外,图像对还标注了11个挑战属性,以促进针对特定挑战的研究。
特点
UVT2000数据集的主要特点包括:1)无需人工对齐:该数据集直接收集了未对齐的图像对,避免了人工对齐的繁琐操作,更符合实际应用场景。2)场景和类别多样性:UVT2000涵盖了各种现实场景和对象类别,具有更高的多样性和挑战性。3)高分辨率:由于无需进行裁剪和缩放,UVT2000保持了原始图像对的分辨率,保证了数据集的质量。4)实用性:UVT2000是第一个未对齐的RGBT SOD数据集,更符合实际场景,具有更高的实用价值。
使用方法
UVT2000数据集可用于研究未对齐RGBT SOD任务,并评估不同方法在处理未对齐图像对时的性能。研究人员可以利用该数据集进行模型训练、测试和评估,并针对不同挑战属性进行针对性研究。此外,UVT2000数据集也可用于其他多模态任务,例如RGBT跟踪、RGBT超分辨率和图像-文本检索等。
背景与挑战
背景概述
UVT2000 数据集是一个用于 RGB 和热成像 (RGBT) 显著目标检测 (SOD) 的基准数据集,由王昆鹏、林丹英、李成龙、涂郑郑和罗斌等人于 2024 年创建。该数据集旨在解决现有 RGBT SOD 方法在处理未经手动对齐的图像对时的性能下降问题。UVT2000 包含 2000 对直接从各种现实场景中捕获的 RGB 和热图像对,无需任何对齐操作。该数据集的创建旨在促进对无需手动对齐的 RGBT SOD 的研究,并为相关领域的研究人员提供一个具有实际意义的基准数据集。
当前挑战
UVT2000 数据集和相关研究面临的主要挑战包括:1) 无需手动对齐的 RGBT SOD 的挑战;2) 构建过程中遇到的挑战。具体而言,未经对齐的 RGB 和热图像对在空间位置和尺度上存在偏差,导致跨模态相关性显著降低,从而难以直接利用多模态互补性。此外,构建一个包含大量未对齐图像对的基准数据集也是一个挑战,需要克服图像采集、标注等方面的困难。
常用场景
经典使用场景
UVT2000数据集主要用于无对齐RGBT显著目标检测(SOD)的研究。该数据集包含2000对未经过手动对齐的RGB和热图像对,涵盖了各种现实场景,并带有11种挑战属性的标注,为研究无对齐RGBT SOD提供了宝贵的资源。
实际应用
UVT2000数据集的实际应用场景包括智能视频监控、遥感图像分析和无人机监控等。该数据集可以与RGB和热传感器设备结合使用,例如监控摄像头、卫星和无人机,以实现无对齐多模态信息协同利用,从而提高这些应用场景的智能化水平。
衍生相关工作
UVT2000数据集的构建为研究无对齐RGBT SOD和相关任务提供了基础,衍生了众多相关研究工作。例如,基于该数据集,研究者们提出了语义引导的非对称相关网络(SACNet),该网络能够有效地建模无对齐多模态图像对之间的相关关系,从而提高显著目标检测的准确性。此外,该数据集也为研究其他无对齐多模态图像对的相关任务提供了参考和借鉴。
以上内容由遇见数据集搜集并总结生成



