WiSARD

arXiv2025-09-30 收录

下载链接：

https://sites.google.com/uw.edu/wisard/home

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了热成像图像与可见光图像的配对，用于训练和评估视觉-热成像图像融合技术。数据集按照80:20的比例分为训练集和验证集，以便对训练后模型的性能进行评估。规模上，数据集包含2752对图像用于训练和验证，以及200对用于测试。任务内容包括图像融合和目标检测。

This dataset comprises paired thermal imaging and visible light images, which are utilized for training and evaluating visual-thermal image fusion techniques. The dataset is split into training and validation sets at an 80:20 ratio to assess the performance of the trained model. In terms of scale, the dataset includes 2752 pairs of images for training and validation, and 200 pairs for testing. The tasks covered include image fusion and object detection.

搜集汇总

数据集介绍

构建方式

在荒野搜救领域，无人机搭载多模态传感器已成为提升搜救效率的关键技术。WiSARD数据集的构建过程严格遵循操作代表性原则，通过部署配备商用视觉与热成像相机的无人机，在华盛顿州多样的荒野环境中进行系统性数据采集。采集过程覆盖森林、田野、岩石海岸及雪地等12类地形，并囊括四季变换与昼夜交替的光照条件，确保数据的环境多样性。视频以30帧率录制，每六帧抽取一帧进行标注，最终形成包含约5.6万张标注图像的数据集，其中包含视觉单模态、热成像单模态及15,453对时空同步的多模态图像对。

特点

WiSARD数据集的核心特点在于其针对荒野搜救场景的独特设计与多模态融合的丰富性。作为首个面向自主荒野搜救无人机的大规模多模态图像数据集，它涵盖了视觉与热成像双模态数据，有效应对低光照、植被遮挡及复杂天气条件下的感知挑战。数据集具有显著的环境多样性，包括不同季节、昼夜时段及地形条件下的图像，并提供了详细的元数据标签，如地形类型、光照条件、人类位置及相机视角。这些特点使其成为测试计算机视觉模型鲁棒性、研究跨模态特征匹配与域自适应学习的理想基准。

使用方法

WiSARD数据集为计算机视觉与机器人学领域的研究提供了重要的实验平台。研究者可利用其多模态图像对开发与评估人体检测、目标跟踪及视觉-热成像配准算法，特别是在复杂荒野环境下的跨模态传感器融合方法。数据集已划分训练、验证与测试子集，并提供了基于YOLOv5的基线检测结果，便于性能比较。用户可依据元数据标签进行条件特定的模型训练，以探索算法在不同环境下的泛化能力。此外，数据集支持对热成像中的热交叉现象、低光照下的特征退化等挑战性场景的深入研究，推动鲁棒感知技术的发展。

背景与挑战

背景概述

WiSARD数据集于2022年由华盛顿大学航空宇航系的研究团队创建，旨在推动野外搜救（WiSAR）中无人机自主视觉算法的发展。该数据集的核心研究问题是解决在复杂多变的野外环境中，利用多模态传感器（可见光与热成像）实现高效、鲁棒的人类目标检测。通过涵盖森林、雪地、海岸等多种地形，以及不同季节、光照和天气条件，WiSARD填补了现有数据集中在野外搜救领域的空白，为计算机视觉与机器人学研究提供了重要的基准，对提升搜救效率与安全性具有深远影响。

当前挑战

WiSARD数据集面临的挑战主要体现在两个方面：在领域问题层面，它致力于解决野外搜救中人类目标检测的难题，包括应对非结构化地形、植被遮挡、高空视角下目标尺寸微小以及多样环境条件（如雪、雾、昼夜交替）带来的识别困难；在构建过程中，挑战涉及多模态数据采集的同步与对齐，尤其是在恶劣光照或热交叉现象下，可见光与热成像图像的特征匹配与配准极为复杂，同时还需确保数据在地形、季节、光照等方面的多样性，以真实反映野外搜救的操作场景。

常用场景

经典使用场景

在荒野搜救领域，无人机辅助的视觉感知技术面临严峻挑战，WiSARD数据集通过提供大规模标注的视觉与热成像图像对，为开发鲁棒的人类检测算法奠定了基准。该数据集涵盖了森林、雪地、海岸等多种地形，以及昼夜、季节和天气变化，使得研究人员能够在高度多样化的环境中评估模型性能，特别是在低光照或复杂遮挡条件下，热成像模态的有效性得以凸显，从而推动多模态融合方法在极端场景下的应用探索。

解决学术问题

WiSARD数据集针对荒野环境中人类检测的独特难题，如非结构化地形、植被遮挡、高空视角下目标尺寸微小以及多变环境条件，提供了系统性的解决方案。它填补了现有自动驾驶数据集在荒野场景下的空白，促进了计算机视觉领域对多模态传感器融合、跨光谱图像配准及小目标检测等核心问题的深入研究。通过引入热成像数据，该数据集有效应对了视觉传感器在低光照条件下的局限性，为算法在真实救生应用中的鲁棒性评估提供了关键支撑。

衍生相关工作

WiSARD数据集的发布激发了多模态感知与荒野搜救交叉领域的研究浪潮。基于该数据集，学者们开展了视觉-热成像图像配准、跨模态特征匹配及鲁棒目标检测等方向的探索，例如利用深度学习改进传统特征点方法在复杂环境中的对齐精度。同时，数据集被用于验证YOLOv5等先进检测模型在极端条件下的适应性，并促进了针对热交叉效应、局部遮挡等挑战的专用算法设计，为后续大规模荒野感知基准的建立提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集