HMSA
收藏arXiv2026-06-29 更新2026-07-01 收录
下载链接:
https://github.com/shangxuanx330/SA Homo
下载链接
链接失效反馈官方服务:
资源简介:
HMSA数据集是一个高分辨率、多模态的卫星图像基准数据集,专为应对尺度变化挑战而构建。该数据集包含11,837对已配准的可见光-红外卫星图像对,每张图像分辨率均为1152×1152像素,数据来源于公开的Landsat8卫星影像。其创建过程旨在通过精心配准不同模态的卫星图像,模拟现实世界中因视角和传感器差异导致的显著尺度差异场景。该数据集主要应用于计算机视觉领域的单应性估计研究,旨在解决在尺度变化显著(如尺度差异高达8倍)的情况下,现有深度学习模型因特征不一致和大位移假设失效而性能下降的问题,推动鲁棒对齐算法的发展。
The HMSA dataset is a high-resolution, multimodal satellite image benchmark dataset specifically constructed to address the challenge of scale variation. It contains 11,837 registered visible-infrared satellite image pairs, each with a resolution of 1152×1152 pixels, and the data is sourced from publicly available Landsat 8 satellite imagery. The dataset was developed to simulate real-world scenes with significant scale discrepancies caused by differences in viewing angles and sensor characteristics, via precise registration of satellite images from different modalities. It is primarily applied to homography estimation research in the field of computer vision, aiming to resolve the performance degradation issue of existing deep learning models caused by inconsistent features and failed large displacement assumptions under significant scale variations (e.g., up to 8-fold scale differences), so as to promote the advancement of robust alignment algorithms.
提供机构:
电子科技大学; 中国科学院大学; 北京理工大学
创建时间:
2026-06-29
搜集汇总
数据集介绍

构建方式
在遥感与计算机视觉领域,尺度变化场景下的图像匹配始终是一个极具挑战的课题。为攻克这一难题,HMSA数据集(High-resolution, Multi-modal, Satellite, Aligned dataset)应运而生。该数据集从公开的Landsat8卫星影像中精心采集与构建,共包含11,837对已配准的可见光-红外卫星图像对,每幅图像的分辨率高达1152×1152。在构建过程中,研究团队严格筛选了具有不同尺度差异的影像对,并基于随机扰动与裁剪策略模拟出尺度变化场景,最终将数据划分为10,478对用于训练、1,359对用于测试,为尺度自适应单应性估计提供了坚实的数据支撑。
特点
HMSA数据集的核心特点在于其独特的跨模态与高分辨率属性,完美契合了尺度变异场景下的研究需求。作为一个跨模态的航空遥感基准,HMSA不仅提供了可见光与红外两种模态的图像对,还覆盖了从1倍至8倍广泛的尺度差异比率,这在现有数据集中极为罕见。图8所示的尺度差异比率分布揭示了其丰富的尺度变化多样性,使得模型能够在大尺度不一致条件下接受严苛考验。此外,该数据集的高分辨率特性(1152×1152)与大规模样本容量,赋予了研究者充足的资源来训练和评估能够应对真实世界中复杂尺度变化的深度学习模型。
使用方法
在使用HMSA数据集时,研究者应遵循论文中提出的数据生成与评估范式。具体而言,对于训练阶段,可采用论文描述的尺度自适应数据增强策略,通过随机裁剪、缩放与扰动从原图对中生成具有可控尺度差异的训练样本。对于测试评估,应将验证集图像对按照尺度差异比率划分为小(1.0-1.5)、中(1.5-4.0)、大(4.0-8.0)三个组别,并以平均角点误差作为主要的量化评估指标。同时,建议结合论文中SA-Homo框架的层次化对齐策略,将SDBM与IHERM模块联合使用,以充分检验面对跨模态与尺度变异挑战时模型的鲁棒性与精度。
背景与挑战
背景概述
HMSA数据集由上海科技大学团队于2021年构建,旨在解决多模态卫星图像在尺度变化场景下的单应性估计难题。该数据集从Landsat8公开卫星影像中采集,包含11,837对已配准的可见光-红外卫星图像对,分辨率高达1152×1152,其中10,478对用于训练,1,359对用于测试。作为跨模态高空遥感基准,HMSA聚焦于图像对间存在显著尺度差异(最高达8倍)的应用场景,填补了现有数据集在尺度变化条件下缺乏大规模、高分辨率多模态数据的空白。其发布极大推动了遥感图像拼接、多模态融合及视频稳定等领域的研究,为评估算法在极端尺度变化下的鲁棒性提供了标准化平台。
当前挑战
HMSA数据集所解决的核心挑战在于尺度变化场景下单应性估计的性能退化问题。传统方法依赖有限位移假设与局部特征一致性,当图像对间尺度差异扩大时,对应点产生大位移与局部外观不一致,导致估计精度骤降。构建过程中面临双重困难:一是需从海量Landsat8影像中筛选高重叠度的可见光-红外配准对,并确保覆盖1至8倍尺度变化范围;二是需设计严格的生成流程以避免无纹理区域干扰,并通过尺度偏差率(SDR)过滤异常样本。此外,跨模态特性加剧了特征匹配的歧义性,而极端的尺度差异(如8倍)进一步放大了大位移与遮挡问题,这对算法的全局相关性捕获与局部精化能力提出了极高要求。
常用场景
经典使用场景
在遥感与计算机视觉的交叉领域中,HMSA数据集最为经典的使用场景是作为尺度变化场景下单应性估计方法的性能评估基准。由于该数据集包含了高分辨率、多模态的可见光-红外卫星图像对,且图像间存在从1倍到8倍不等的显著尺度差异,研究者能够在此平台上系统地验证算法在面对尺度变化时的鲁棒性与精度。其典型应用包括:在不同尺度比率下的跨模态图像对齐任务,以及作为传统尺度相似场景与挑战性尺度变化场景之间的过渡性测试工具,从而全面评估模型的泛化能力。
实际应用
在实际应用层面,HMSA数据集所依托的尺度自适应单应性估计技术可广泛部署于多种遥感与视觉任务中。例如,在无人机航拍图像拼接中,不同飞行高度导致的尺度差异可通过该数据集训练的方法进行快速对齐,生成无缝的全景图。在多模态遥感图像融合领域,可见光与红外传感器因分辨率不同而产生的尺度偏差,亦可借助此类算法实现像素级精确配准,进而提升目标检测与分类的准确性。此外,在视频稳像、平面物体跟踪等需要跨尺度特征一致性的场景中,基于HMSA数据集训练的模型能够提供更稳定的几何变换估计,显著增强系统在真实复杂环境中的适应性。
衍生相关工作
HMSA数据集的发布催生了一系列具有代表性的衍生研究工作。其中最直接的经典工作是SA-Homo框架,该工作创新性地提出了分层尺度对齐策略,通过全局的尺度感知差异桥接模块与轻量级的迭代精化模块协同运作,在HMSA数据集上取得了相对于GFNet、McNet等前沿方法显著的精度提升。此外,该数据集还被用于验证多尺度线性注意力机制、跨尺度相似性矩阵模块以及Sinkhorn-Knopp算法在单应性估计中的有效性,启发了后续研究者在特征匹配阶段引入更鲁棒的全局相关性表示。这些衍生工作不仅深化了对尺度变化场景下几何变换规律的理解,也为跨模态遥感图像分析领域提供了重要的方法学支撑。
以上内容由遇见数据集搜集并总结生成



