UVT20K

Name: UVT20K
Creator: 智能计算与信号处理教育部重点实验室，安徽多模态认知计算省级重点实验室，安徽大学计算机科学与技术学院
Published: 2024-12-19 14:52:12
License: 暂无描述

arXiv2024-12-19 更新2024-12-21 收录

下载链接：

https://github.com/Angknpng/PCNet

下载链接

链接失效反馈

官方服务：

资源简介：

UVT20K是由安徽大学智能计算与信号处理教育部重点实验室创建的大规模非对齐RGB-T显著目标检测数据集，包含20,000对未对齐的可见光和热成像图像，覆盖407个场景和1256个对象类别。数据集通过真实场景采集，包含多种挑战，如低光照、图像杂乱和复杂显著对象等。每个样本都经过详细的标注，包括显著性掩码、涂鸦、边界和挑战属性。数据集的创建旨在推动非对齐RGB-T显著目标检测的研究，解决复杂场景下的目标检测问题。

UVT20K is a large-scale unaligned RGB-T salient object detection dataset developed by the Key Laboratory of Intelligent Computing and Signal Processing of the Ministry of Education, Anhui University. It consists of 20,000 pairs of unaligned visible and thermal imaging images, covering 407 scenarios and 1256 object categories. The dataset is collected from real-world environments, and encompasses various challenges including low-light conditions, cluttered scenes, and complex salient objects. Each sample is equipped with detailed annotations, namely saliency masks, scribbles, bounding boxes, and challenge attributes. The dataset is constructed to advance research on unaligned RGB-T salient object detection and address target detection problems in complex scenarios.

提供机构：

智能计算与信号处理教育部重点实验室，安徽多模态认知计算省级重点实验室，安徽大学计算机科学与技术学院

创建时间：

2024-12-19

搜集汇总

数据集介绍

构建方式

UVT20K数据集通过使用Hikvision DS-2TP2310VF/W(B)和FLIR SC620设备，在真实场景中采集了20,000对未对齐的RGB-T图像对。这些设备配备了CCD和热红外摄像头，尽管集成在同一设备中，但由于视差和视角差异，导致图像对在空间和尺度上存在未对齐的情况。数据集的构建过程包括初步质量扫描，去除重复、无目标或损坏的样本，随后由十名标注员对高质量的22,000+图像对进行标注，最终筛选出20,000对作为最终数据集。每对图像都标注了显著性掩码、涂鸦、边界和挑战属性，确保了数据集的多样性和复杂性。

使用方法

UVT20K数据集适用于多种显著性目标检测任务，尤其是未对齐RGB-T图像的显著性检测。研究者可以使用该数据集进行模型训练和评估，探索多模态信息融合的方法。数据集的标注信息丰富，支持全监督、弱监督等多种学习方式。此外，数据集的挑战属性分布合理，能够有效评估模型在复杂场景下的鲁棒性。研究者可以通过访问数据集的GitHub页面获取数据和代码，进一步开展相关研究。

背景与挑战

背景概述

UVT20K数据集由安徽大学的智能计算与信号处理教育部重点实验室和多模态认知计算安徽省重点实验室的研究团队构建，旨在推动无对齐RGB-T显著目标检测的研究。该数据集于2024年发布，包含20,000对未对齐的可见光-热红外图像，涵盖407个场景和1256个对象类别，具有高度的多样性和复杂性。UVT20K的构建旨在解决现有数据集在规模和多样性上的不足，特别是针对复杂场景中的显著目标检测问题，如低光照、图像杂乱和复杂的前景背景关系等。该数据集的发布为无对齐RGB-T显著目标检测的研究提供了重要的基准，推动了多模态信息融合技术的发展。

当前挑战

UVT20K数据集的构建面临多重挑战。首先，收集和标注未对齐的可见光-热红外图像对需要大量的人力和时间，尤其是在处理复杂场景时，标注的准确性和一致性难以保证。其次，未对齐的图像对在空间和尺度上存在显著的偏差，导致多模态信息的对应关系难以直接利用，这对模型的多模态融合能力提出了更高的要求。此外，数据集中的多样性和复杂性使得模型在处理不同挑战时需要具备更强的鲁棒性。最后，如何在无对齐的图像对中准确建模多模态之间的相关性，是该数据集面临的核心挑战之一。

常用场景

经典使用场景

UVT20K数据集的经典使用场景主要集中在无对齐RGB-T显著目标检测任务中。该数据集通过提供20,000对未对齐的可见光与热红外图像，涵盖了407个场景和1256个对象类别，为研究者提供了丰富的多样性和复杂性。研究者可以利用这些图像对进行模型训练和评估，特别是在复杂场景下，如低光照、背景杂乱和复杂目标等挑战性环境中，探索如何有效融合可见光与热红外图像的互补信息，从而提升显著目标检测的鲁棒性。

解决学术问题

UVT20K数据集解决了现有RGB-T显著目标检测数据集规模有限、场景单一的问题。通过提供大规模、多样化的未对齐图像对，该数据集为研究者提供了丰富的实验材料，推动了无对齐RGB-T显著目标检测的研究进展。此外，数据集中的全面标注（如显著性掩码、涂鸦、边界和挑战属性）为弱监督学习和边界增强算法的研究提供了基础，进一步拓宽了显著目标检测的研究领域。

实际应用

UVT20K数据集在实际应用中具有广泛的应用前景，特别是在需要处理复杂场景的领域。例如，在自动驾驶中，车辆需要在低光照或恶劣天气条件下识别行人或障碍物，热红外图像可以提供额外的信息支持。此外，在安防监控中，热红外图像可以帮助在夜间或低能见度环境下检测潜在威胁。通过利用UVT20K数据集训练的模型，可以有效提升这些应用场景中的目标检测性能，增强系统的鲁棒性和可靠性。

数据集最近研究