Cryo-Bench

github2026-03-04 更新2026-03-06 收录

下载链接：

https://github.com/Sk-2103/Cryo-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

Cryo-Bench是一个社区基准测试，用于评估地理空间基础模型（GFMs）在五个冰冻圈遥感任务上的表现，涵盖冰川湖、冰上碎屑、海冰和冰裂前沿等。它基于PANGAEA评估协议，使用Sentinel-1/2、Landsat-8、WorldView-2和历史SAR任务的多传感器卫星图像构建。

Cryo-Bench is a community benchmark for evaluating the performance of Geospatial Foundation Models (GFMs) across five cryospheric remote sensing tasks, including glacial lakes, supraglacial debris, sea ice, ice fracture fronts, etc. It is built upon the PANGAEA assessment protocol and constructed using multi-sensor satellite imagery from Sentinel-1/2, Landsat-8, WorldView-2, and historical SAR missions.

创建时间：

2026-02-25

原始信息汇总

Cryo-Bench 数据集概述

数据集简介

Cryo-Bench 是一个用于评估地理空间基础模型在冰冻圈应用上的社区基准。它基于 PANGAEA 评估协议构建，使用来自 Sentinel-1/2、Landsat-8、WorldView-2 和历史 SAR 任务的多传感器卫星影像。

任务与数据集构成

该基准包含五个评估任务，覆盖冰冻圈的关键组成部分：

数据集	组成部分	地理位置	传感器	类别	辅助数据	相关论文	下载链接
GSDD	冰面碎屑	全球	Sentinel-2	二分类	坡度、高程、流速	https://www.sciencedirect.com/science/article/pii/S2666017225001257	https://zenodo.org/records/17161810
GLID	冰川湖	喜马拉雅山脉	WorldView-2, Sentinel-2, Landsat-8, Gaofen-2	二分类	—	https://www.sciencedirect.com/science/article/pii/S002216942500410X	https://zenodo.org/records/14838695
GLD	冰川湖	喜马拉雅山脉	Sentinel-2	二分类	SAR相干性、坡度、高程	https://www.sciencedirect.com/science/article/pii/S1569843222002734	https://zenodo.org/records/16986936
SICD	海冰	加拿大和格陵兰北极地区	Sentinel-1	多分类	入射角	https://egusphere.copernicus.org/preprints/2023/egusphere-2023-2648/	https://huggingface.co/datasets/torchgeo/ai4artic-sea-ice-challenge
CaFFe	冰裂前缘	格陵兰、阿拉斯加、南极半岛	ERS-1/2, Envisat, RADARSAT-1, ALOS PALSAR, TSX, TDX, Sentinel-1	多分类	—	https://essd.copernicus.org/articles/14/4287/2022/	https://doi.pangaea.de/10.1594/PANGAEA.940950

基准评估结果

下表报告了所有模型在使用 UPerNet 解码器、编码器冻结和100%训练数据情况下的 mIoU（↑）结果。排名（↓）是五个任务的平均值。基线模型（U-Net, ViT）为从头训练。

模型	GLID	GLD	SICD	CaFFe	GSDD	平均 mIoU ↑	平均排名 ↓
CROMA	78.52	76.84	24.84	42.03	74.15	59.28	6.60
DOFA	92.61	80.44	19.20	50.71	72.96	63.18	6.20
GFM-Swin	89.68	72.42	18.98	58.13	73.00	62.44	9.40
Prithvi	71.11	75.84	20.59	32.01	70.52	54.01	13.60
RemoteCLIP	90.88	69.52	22.71	56.64	73.42	62.63	8.00
SatlasNet	77.02	77.11	24.04	33.96	73.70	57.17	8.40
Scale-MAE	90.13	72.65	12.90	58.19	73.47	61.47	8.80
SpectralGPT	70.87	78.90	15.98	32.70	73.22	54.33	11.80
S12-MoCo	75.51	77.38	26.09	36.21	73.03	57.64	8.80
S12-DINO	75.69	75.91	27.28	35.58	71.19	57.13	10.20
S12-MAE	75.71	77.39	20.63	36.99	73.51	56.85	8.20
S12-Data2Vec	75.19	77.10	24.15	35.96	73.68	57.22	9.00
TerraMind	88.26	79.10	31.48	46.64	74.63	64.02	3.40
RAMEN	82.17	73.67	16.52	25.10	70.56	57.17	12.80
U-Net (基线)	91.58	77.51	29.11	59.82	73.89	66.38	2.80
ViT (基线)	71.58	80.18	16.17	39.90	74.41	56.45	8.00

粗体 = 最佳性能 · 斜体 = 次佳性能所有地理空间基础模型的编码器均保持冻结。U-Net 和 ViT 为从头训练。

许可证

本项目采用 MIT 许可证。

致谢

Cryo-Bench 建立在 PANGAEA 基准和 RAMEN 框架之上。感谢 DOFA、TerraMind、Prithvi、SatlasNet 以及本基准中包含的所有其他基础模型的开发者。同时感谢 GSDD、GLID、GLD、SICD 和 CaFFe 数据集的作者公开其数据。

搜集汇总

数据集介绍

构建方式

在冰冻圈遥感研究领域，Cryo-Bench的构建遵循严谨的科学整合路径。该基准测试集并非从头创建原始数据，而是系统性地汇集了五个已公开的权威冰冻圈遥感数据集，涵盖冰川湖、表碛、海冰和冰裂前锋等关键要素。其构建核心基于PANGAEA评估协议，通过统一的标准对来自Sentinel-1/2、Landsat-8、WorldView-2及历史合成孔径雷达任务的多源传感器影像进行组织与标注，确保了评估框架的一致性与可比性。

特点

Cryo-Bench的突出特点在于其面向地理空间基础模型的综合性评估定位。它首次将多个独立的冰冻圈遥感任务整合于一个统一的基准之下，任务类型兼具二元分类与多类别分割，地理范围横跨全球、喜马拉雅、北极等多个典型区域。数据集不仅提供多光谱与雷达影像，部分任务还融合了坡度、高程、相干性等辅助地理数据，为模型理解复杂的冰冻圈地物提供了多维信息支撑，从而能够全面检验模型在不同传感器、不同地物、不同场景下的泛化与迁移能力。

使用方法

对于希望评估或开发地理空间人工智能模型的研究者而言，Cryo-Bench提供了清晰的使用路径。用户可通过Hugging Face平台或各原始数据集的发布页面获取数据。基准测试遵循冻结编码器与全量训练数据的标准协议，通常搭配UPerNet解码器进行分割任务评估，并以平均交并比作为核心性能指标。研究者既可以利用其预定义的五个任务流水线对现有基础模型进行系统性评测与排名，也可将其作为高质量、多任务的训练与验证数据，用以微调或开发专注于冰冻圈解译的新模型。

背景与挑战

背景概述

随着地球科学领域对冰冻圈动态监测需求的日益增长，遥感技术与人工智能的融合成为关键研究方向。Cryo-Bench作为一项社区基准测试，由研究团队基于PANGAEA评估协议构建，旨在系统评估地理空间基础模型在冰川湖泊、冰上碎屑、海冰及冰裂前沿等五大冰冻圈遥感任务上的性能。该数据集整合了Sentinel-1/2、Landsat-8等多源卫星影像，为模型在复杂地理环境中的泛化能力提供了标准化测试平台，推动了冰冻圈遥感分析方法的创新与比较。

当前挑战

冰冻圈遥感任务面临诸多挑战，例如冰上碎屑与冰川湖泊的精细分割需克服影像中纹理相似性与边界模糊问题，而海冰分类则受限于多云天气与传感器噪声干扰。在数据集构建过程中，多源卫星数据的时空对齐与标注一致性处理尤为困难，不同传感器的分辨率差异与地理坐标系统整合增加了数据预处理复杂度。此外，全球性冰冻圈现象的时空异质性要求标注数据具备广泛的地理覆盖与时间序列代表性，这对数据采集与质量控制提出了更高要求。

常用场景

经典使用场景

在冰冻圈遥感研究领域，Cryo-Bench数据集作为一项综合性基准测试工具，其经典应用场景在于系统评估地理空间基础模型在多种冰冻圈要素识别任务中的泛化性能与鲁棒性。该数据集整合了冰川湖、冰上碎屑、海冰及冰裂前沿等五个关键任务的遥感影像，通过统一的多传感器数据与标准化评估协议，为研究人员提供了一个跨任务、跨区域的公平比较平台，从而深入探索模型在复杂冰雪环境下的感知能力。

解决学术问题

Cryo-Bench数据集有效应对了冰冻圈遥感中模型评估标准不一、任务覆盖局限的学术挑战。它通过集成多个公开数据集并构建统一的评估框架，解决了以往研究在数据异构性、任务孤立性方面的瓶颈，使得地理空间基础模型能够在多任务、多传感器条件下进行系统性验证。这一工作不仅推动了模型跨任务迁移能力的研究，也为冰冻圈要素的自动监测提供了可靠的性能基准，促进了遥感人工智能方法在极地与环境科学中的深度融合。

衍生相关工作

围绕Cryo-Bench数据集，已衍生出一系列经典的地理空间基础模型比较与改进研究。例如，基于PANGAEA评估协议构建的基准测试框架，促进了DOFA、TerraMind、Prithvi等模型在冰冻圈任务上的性能分析；同时，该数据集也启发了针对多传感器融合、小样本学习及跨域适应等方法的创新，如利用Sentinel-1/2协同数据进行海冰分类、结合地形辅助特征增强冰川湖识别等。这些工作不仅丰富了冰冻圈遥感的方法体系，也为后续构建更专化、更鲁棒的极地智能解译模型奠定了坚实基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集