WHU-MARS
收藏github2026-05-20 更新2026-05-21 收录
下载链接:
https://github.com/msm8976/WHU-MARS
下载链接
链接失效反馈官方服务:
资源简介:
WHU-MARS是一个多光谱空地基准数据集,旨在支持任何场景下的行人重识别任务,结合了空中和地面视角的多光谱数据,以促进跨场景行人识别研究。
创建时间:
2026-05-20
原始信息汇总
数据集概览:WHU-MARS
WHU-MARS 是一个多光谱空地基准数据集,面向任意场景下的人物重识别任务。该工作由 Yuxuan Zhao、Zhongao Zhou、Bin Yang、He Li、Jian Liang、Jun Chen、Bo Du、Mang Ye 等人完成,并已被 CVPR 2026 接收为 Highlight 论文。
核心特性
- 多光谱:包含多光谱图像信息(具体光谱波段请参考原论文)。
- 空地结合:同时涵盖空中(如无人机)和地面视角的人物图像。
- 任意场景:旨在应对复杂多变的环境,提升人物重识别的泛化能力。
论文与资源
- 论文标题:WHU-MARS: A Multispectral Aerial-Ground Benchmark Towards Any-Scenario Person Re-Identification
- 所属会议:CVPR 2026 (Highlight)
- 仓库地址:https://github.com/msm8976/WHU-MARS
- 预览海报:https://github.com/msm8976/WHU-MARS/raw/main/res/poster.png
注意事项
- 数据集的具体下载方式、标注细节、评估协议等信息请参考原论文或仓库中的其他文档。
- 以上信息均整理自提供的 README 文件及仓库页面。
搜集汇总
数据集介绍

构建方式
WHU-MARS数据集由武汉大学团队构建,旨在攻克任意场景下跨模态行人重识别的挑战。该数据集融合了多光谱与航空-地面双重视角,通过搭载多光谱相机的无人机与地面监控设备协同采集,覆盖光照变化、视角差异、遮挡等复杂环境中的行人图像。构建过程严格遵循多光谱配准与身份标注流程,确保每个行人在不同光谱通道及视角下均有对应标记,形成包含多种光谱波段和视角维度的结构化数据集合。
特点
WHU-MARS数据集的核心特色在于其多光谱与航空-地面跨视角的融合设计,打破了传统单光谱或单一视角数据集的局限。数据集包含近红外、可见光等多光谱通道,能够捕捉可见光下难以区分的细节特征,同时航空视角与地面视角的互补性极大提升了模型对尺度变化、姿态多样性的适应能力。此外,其丰富的场景覆盖和身份多样性,为研究无偏、鲁棒的行人重识别算法提供了坚实基础。
使用方法
使用WHU-MARS数据集时,研究者可加载预划分的多光谱图像与航空-地面配对数据,通过定义的多光谱特征提取网络进行模型训练。数据集提供了标准化的评估协议,包括跨光谱和跨视角的检索任务,支持基于度量学习的损失函数验证。建议采用多分支网络结构分别处理不同光谱与视角分支,并利用数据集中的身份标签进行联合优化,最终通过平均精度(mAP)和累积匹配曲线(CMC)评估性能。
背景与挑战
背景概述
行人重识别作为计算机视觉领域的关键技术,致力于在跨摄像头场景下实现行人的准确匹配与检索。然而,现有数据集多局限于可见光或近红外单一模态,且视角多为固定地面监控,难以应对复杂多变的真实应用环境。在此背景下,武汉大学研究团队于2025年发布了WHU-MARS多光谱空地行人重识别数据集,由Yuxuan Zhao、Zhongao Zhou、Bin Yang等学者共同构建,相关成果荣膺CVPR 2026 Highlight。该数据集核心研究问题聚焦于任意场景下多光谱与空地视角融合的行人重识别,通过整合可见光与近红外等多光谱信息,结合高空无人机与地面监控的协作视角,突破了传统数据集的模态与视角局限,对提升行人重识别在安防监控、智能交通等领域的泛化性与鲁棒性具有重要推动作用。
当前挑战
WHU-MARS数据集所面临的挑战兼具领域前沿性与构建复杂性。在领域问题层面,跨模态与跨视角的显著差异导致行人的外观、姿态及光照条件高度不一致,传统单模态特征难以适应多光谱信息的高维度与异质性,如何设计鲁棒的特征对齐与融合策略成为核心难点。此外,无人机高空视角与地面平视视角的行人尺度剧变、遮挡频繁及背景干扰加剧了匹配的歧义性。在构建过程中,同步采集空地多光谱数据需协调多种传感器与飞行平台,确保光照、时间与空间同步性,同时标注大规模多视角行人身份面临极高人力成本与精度要求,如何平衡数据多样性、标注质量与规模化效率亦是实践中的严峻挑战。
常用场景
经典使用场景
在智慧安防与多模态视觉监控领域,跨场景行人重识别是一项极具挑战性的任务。WHU-MARS数据集作为首个融合多光谱与空地视角的大规模基准,提供了涵盖可见光、近红外等多种光谱通道的图像数据,并同时包含无人机航拍与地面固定摄像机采集的视角。其经典使用场景在于对任意场景下行人身份的准确检索,尤其适用于光照剧变、视角差异显著、遮挡频繁的复杂环境,为多光谱融合与视角鲁棒性研究提供了标准化评估平台。
实际应用
在实际公共安全与智能监控系统中,WHU-MARS所模拟的全天候、多视角场景为高效行人追踪与身份确认提供了关键数据支撑。例如,在大型活动安保中,无人机可配合地面摄像头实现目标行人在不同光照与视角下的无缝衔接识别。此外,该数据集还可用于验证夜间执勤、反恐应急等极端条件下的身份检索算法,助力构建鲁棒的端到端多模态识别系统,显著提升复杂环境下的安防响应与决策能力。
衍生相关工作
基于WHU-MARS,学术界已衍生出一系列具有影响力的经典工作,包括面向多光谱图像的自适应特征融合网络、跨视角域对齐生成对抗网络、以及基于Transformer的异构数据协同识别模型。这些工作不仅拓展了行人重识别的技术边界,还推动了多模态学习与空地协同感知等新兴研究范式的形成。此外,该数据集还被广泛应用于域泛化、开放集识别及小样本学习等前沿课题中,成为验证模型跨场景泛化能力的标准测试平台。
以上内容由遇见数据集搜集并总结生成



