SSL4SAR
收藏arXiv2025-07-02 更新2025-08-15 收录
下载链接:
https://zenodo.org/records/14748506
下载链接
链接失效反馈官方服务:
资源简介:
SSL4SAR是一个未标记的SAR数据集,包含9,562张Sentinel-1图像和14张Sentinel-2图像,这些图像展示了北极14个不同大小和崩解前缘几何形状的冰川。数据集还包括每个冰川一张无云的光学图像,这些图像是在2020年6月至8月之间由Sentinel-2捕获的。SSL4SAR数据集是为了解决冰川崩解前缘提取问题而创建的,旨在为后续分析提供大时空数据库的崩解前缘位置。SSL4SAR数据集的创建是为了解决冰川崩解前缘提取问题,旨在为后续分析提供大时空数据库的崩解前缘位置。SSL4SAR数据集主要用于自监督预训练,帮助深度学习模型更好地理解冰川崩解前缘的动态变化,从而提高模型在崩解前缘提取任务上的性能。
SSL4SAR is an unlabeled SAR dataset consisting of 9,562 Sentinel-1 images and 14 Sentinel-2 images, which depict 14 Arctic glaciers with diverse sizes and calving front geometries. The dataset also includes one cloud-free optical image per glacier, captured by Sentinel-2 between June and August 2020. Developed to address the glacier calving front extraction task, SSL4SAR serves as a large-scale spatiotemporal database that provides calving front locations for subsequent analytical studies. Primarily designed for self-supervised pre-training, this dataset enables deep learning models to better comprehend the dynamic changes of glacier calving fronts, thus enhancing the models' performance on calving front extraction tasks.
提供机构:
弗里德里希·亚历山大大学埃尔兰根-纽伦堡分校计算机科学系模式识别实验室
创建时间:
2025-07-02
搜集汇总
数据集介绍

构建方式
SSL4SAR数据集构建采用了多源遥感数据融合策略,通过整合9,562幅Sentinel-1 SAR影像和14幅Sentinel-2光学影像,覆盖2015-2022年间北极14条冰川的冰舌区域。数据预处理包含轨道校正、热噪声消除和地形辐射校正等关键步骤,并采用北极极射投影(EPSG:3995)和UTM 6N投影(EPSG:32606)进行空间重采样至10米分辨率。针对光学数据,额外集成了气溶胶光学厚度、水汽含量等12个光谱波段及衍生数据产品,构建了冰川-海洋边界解译的多模态监督信号。
使用方法
数据集支持两种创新性应用范式:1) 通过OptSimMIM框架实现掩膜图像建模,以SAR影像遮蔽区域预测对应光学影像像素值;2) 采用OptTranslator架构进行跨模态翻译,训练卷积头完成SAR到光学影像的端到端转换。在冰川崩解前沿提取任务中,建议先以ImageNet预训练权重初始化Swin Transformer编码器,再结合本数据集进行领域自适应预训练,最终在CaFFe基准上微调。典型工作流包含滑动窗口采样(50%重叠)、四向测试时增强及五模型置信度集成,可生成不确定性热力图辅助结果解读。
背景与挑战
背景概述
SSL4SAR数据集由Friedrich-Alexander-Universität Erlangen-Nürnberg的研究团队于2025年提出,旨在解决冰川崩解前缘从合成孔径雷达(SAR)图像中自动提取的挑战。该数据集包含9,563幅Sentinel-1和14幅Sentinel-2北极冰川图像,专注于通过自监督学习技术优化深度学习模型在遥感图像分析中的表现。SSL4SAR的创建填补了冰川监测领域大规模时空数据库的空白,显著提升了季节性冰川变化的监测精度,对理解冰川消融机制及其对气候变化的响应具有重要意义。
当前挑战
SSL4SAR数据集面临的挑战主要包括两方面:领域问题的挑战和构建过程的挑战。在领域问题方面,SAR图像与自然图像存在显著的领域差异,如斑点噪声、较低的分辨率以及不同冰类型的相似后向散射模式,这增加了冰川崩解前缘精确分割的难度。构建过程中的挑战包括数据收集的复杂性,如需要处理大量未标记的SAR图像,并确保与光学图像的精确配准,同时还需克服极地夜间和恶劣天气条件对光学图像获取的限制。此外,数据预处理步骤如轨道文件应用、噪声去除和地形校正等也增加了数据集构建的技术难度。
常用场景
经典使用场景
SSL4SAR数据集在冰川崩解前缘提取任务中展现了其经典应用场景。通过结合合成孔径雷达(SAR)和光学影像数据,该数据集为深度学习模型提供了丰富的自监督预训练资源。特别是在极地夜间或恶劣天气条件下,光学影像难以获取时,SAR影像成为监测冰川动态的关键数据源。数据集中的9,562幅Sentinel-1 SAR影像和14幅Sentinel-2光学影像,覆盖了14个北极冰川的不同几何形态和尺寸,为模型训练提供了多样化的样本。
解决学术问题
SSL4SAR数据集解决了冰川监测领域的关键学术问题。传统方法依赖人工标注冰川崩解前缘,效率低下且难以应对大规模数据。该数据集通过自监督学习技术,缓解了标注数据稀缺的挑战,并针对SAR与自然影像间的领域偏移问题,提出了多模态预训练策略。其提出的混合Transformer-CNN架构(TYRION)将平均距离误差(MDE)降低至293米,较先前最佳模型提升67米,显著推进了冰川前缘自动提取的精度边界。
实际应用
在实际应用中,SSL4SAR数据集支持对冰川季节性变化的精准监测。通过集成多时相SAR影像和光学参考数据,该数据集训练的模型可生成平滑的冰川前缘轮廓,为极地冰川质量损失评估提供可靠工具。例如,在格陵兰和南极冰川监测中,模型输出可量化崩解速率,辅助研究冰-海相互作用机制。其接近人类标注水平(75米 vs 38米MDE)的性能,使其具备替代人工标注的潜力,大幅提升大范围冰川动态分析的效率。
数据集最近研究
最新研究方向
随着全球冰川消融速度的急剧加快,对冰川崩解前缘的精确监测成为理解冰川消融机制的关键。SSL4SAR数据集的提出,为合成孔径雷达(SAR)影像中的冰川崩解前缘自动提取任务提供了重要的自监督学习基础。该领域的最新研究方向聚焦于多模态自监督预训练技术的创新,通过结合SAR与光学影像的优势,克服传统ImageNet预训练模型在遥感影像分析中的领域偏移问题。前沿工作提出了混合Swin Transformer与残差CNN的新型架构TYRION,其在CaFFe基准数据集上实现了293米的平均距离误差,较先前最佳模型提升了67米。这一突破性进展不仅将算法性能推近人类专家水平(38米),更为极地冰川季节性变化的精准监测提供了可靠技术支撑。
相关研究论文
- 1SSL4SAR: Self-Supervised Learning for Glacier Calving Front Extraction from SAR Imagery弗里德里希·亚历山大大学埃尔兰根-纽伦堡分校计算机科学系模式识别实验室 · 2025年
以上内容由遇见数据集搜集并总结生成



