Landsat-Bench

github2025-06-11 更新2025-06-12 收录

下载链接：

https://github.com/isaaccorley/landsatbench

下载链接

链接失效反馈

官方服务：

资源简介：

Landsat-Bench是一个用于地理空间基础模型（GFM）的新基准测试，包含三个Landsat变体的现有遥感数据集：EuroSAT-L、BigEarthNet-L和LC100-L。

Landsat-Bench is a new benchmark for geospatial fundamental models (GFM), containing existing remote sensing datasets of three Landsat variants: EuroSAT-L, BigEarthNet-L, and LC100-L.

创建时间：

2025-06-11

原始信息汇总

Landsat-Bench 数据集概述

数据集简介

名称: Landsat-Bench
用途: 用于地理空间基础模型（GFM）预训练的基准测试
核心内容: 包含三个Landsat变体的遥感数据集（EuroSAT-L、BigEarthNet-L、LC100-L）

数据集组成

EuroSAT-L
- 原始数据集变体
- 单标签分类任务
BigEarthNet-L
- 原始数据集变体
- 多标签分类任务（ML）
LC100-L
- 原始数据集变体
- 多时相数据集（MT）

技术特性

数据来源: Landsat 8影像（来自USGS和Planetary Computer STAC APIs）
数据格式: 元数据保存为parquet格式
预训练模型: 包含9个基线模型的预训练结果

评估指标

EuroSAT-L: 总体准确率（OA）
BigEarthNet-L/LC100-L: 微观平均精度（mAP）
评估方法: KNN（k=5）和线性探针（LP）

获取方式

HuggingFace仓库:
预计算嵌入: Landsat-Bench嵌入

使用方法

python from landsatbench.datamodule import LandsatDatamodule

dm = LandsatDataModule(name="eurosat", root=root, batch_size=16, num_workers=4, download=False) dm.setup(stage="fit")

引用格式

bibtex @misc{corley2025landsatbenchdatasetsbenchmarkslandsat, title={Landsat-Bench: Datasets and Benchmarks for Landsat Foundation Models}, author={Isaac Corley and Lakshay Sharma and Ruth Crasto}, year={2025}, eprint={2506.08780}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2506.08780}, }

搜集汇总

数据集介绍

构建方式

Landsat-Bench数据集通过整合Landsat 8卫星影像数据，对EuroSAT、BigEarthNet和LC100三大遥感数据集进行了系统性重构。构建过程中采用美国地质调查局(USGS)和Planetary Computer的STAC API获取原始影像，通过专业脚本提取元数据并存储为Parquet格式，确保了数据获取的规范性和可追溯性。该数据集创新性地将多源遥感数据统一到Landsat影像标准下，为地理空间基础模型研究提供了基准平台。

特点

作为专为地理空间基础模型设计的基准数据集，Landsat-Bench包含EuroSAT-L、BigEarthNet-L和LC100-L三个标准化子集，覆盖了从单标签分类到多标签、多时相分析的丰富场景。数据集特别注重影像质量的一致性，所有数据均源自Landsat 8的标准化采集系统，并经过严格的几何校正和辐射定标处理。其独特的价值在于首次实现了跨数据集的Landsat影像基准测试，为遥感领域模型性能评估提供了统一尺度。

使用方法

研究者可通过安装landsatbench软件包快速加载数据集，该工具包提供标准化的DataModule接口，支持灵活配置批量大小和并行加载参数。数据集支持端到端的模型训练流程，包含明确的训练/测试阶段划分方法。为便于性能评估，项目提供了预计算的特征嵌入和标准化评估脚本，支持K近邻和线性探测两种评估模式，用户可直接复现论文中的基准测试结果。所有数据集资源均托管于HuggingFace平台，确保全球研究者的便捷访问。

背景与挑战

背景概述

Landsat-Bench是由Isaac Corley、Lakshay Sharma和Ruth Crasto等研究人员于2025年推出的一个地理空间基础模型（GFM）基准测试数据集。该数据集基于Landsat影像构建，包含EuroSAT-L、BigEarthNet-L和LC100-L三个经过改造的遥感数据集变体，旨在推动遥感影像分析领域的发展。Landsat-Bench的推出为地理空间基础模型的预训练和评估提供了标准化工具，其核心研究问题聚焦于如何利用多源遥感数据提升地物分类和目标识别的精度。该数据集已被ICML TerraBytes Workshop接受，并在HuggingFace平台上公开发布，为遥感影像处理领域的研究提供了重要的数据支持。

当前挑战

Landsat-Bench面临的挑战主要体现在两个方面：领域问题的挑战和构建过程的挑战。在领域问题方面，该数据集旨在解决遥感影像分类和目标识别中的多标签、多时相数据处理难题，尤其是如何有效融合Landsat影像的多光谱信息以提升模型泛化能力。在构建过程中，研究人员需要克服原始数据异构性带来的整合困难，包括不同数据集间的标注标准差异、影像分辨率不一致等问题。此外，从USGS和Planetary Computer STAC APIs下载大规模Landsat 8影像数据时，还需处理数据获取的时效性和存储管理的技术挑战。

常用场景

经典使用场景

Landsat-Bench数据集在遥感影像分析领域具有重要价值，其经典使用场景包括土地覆盖分类、环境监测和灾害评估。通过提供Landsat影像的标准化数据集，研究人员能够高效训练和评估地理空间基础模型（GFM），从而在复杂的地表覆盖分类任务中实现高精度识别。该数据集的多时相和多标签特性使其成为动态环境监测的理想选择。

实际应用

在实际应用中，Landsat-Bench支持农业产量预测、城市扩张监测和森林资源管理等重要领域。政府部门和环保机构可利用该数据集训练的高精度模型，实时监测土地利用变化，为政策制定提供数据支持。其开放的HuggingFace接口降低了技术门槛，促进了遥感技术在行业中的普及。

衍生相关工作

基于Landsat-Bench数据集，已衍生出多项重要研究工作，包括SSL4EO-L预训练模型的性能优化和多模态遥感数据分析。TorchGeo等开源库整合了该数据集的评估方法，推动了地理空间深度学习工具链的完善。ICML TerraBytes Workshop的相关研究进一步扩展了该数据集在时序分析中的应用场景。

以上内容由遇见数据集搜集并总结生成