Spectral Earth dataset
收藏github2025-04-15 更新2025-05-08 收录
下载链接:
https://github.com/AABNassim/spectral_earth
下载链接
链接失效反馈官方服务:
资源简介:
Spectral Earth数据集是一个来自EnMAP(环境制图与分析计划)卫星任务的大规模高光谱数据集。它涵盖了多样化的地理区域,包含约3.3TB的高光谱图像。
The Spectral Earth dataset is a large-scale hyperspectral dataset derived from the EnMAP (Environmental Mapping and Analysis Program) satellite mission. It encompasses diverse geographical regions and includes approximately 3.3TB of hyperspectral images.
创建时间:
2025-04-15
原始信息汇总
Spectral Earth 数据集概述
数据集简介
- 名称: Spectral Earth
- 关联论文: SpectralEarth: Training Hyperspectral Foundation Models at Scale
- 数据来源: EnMAP (Environmental Mapping and Analysis Program) 卫星任务
- 数据量: 约3.3TB 高光谱影像
- 地理覆盖: 多样化的地理区域
预训练数据集
- 内容: 大规模高光谱数据集
- 获取方式: 通过 DLR GeoService Portal 下载(需注册账号)
下游任务
数据集支持以下下游任务:
分类任务
-
EnMAP-CDL (美国作物类型分割)
- 类别: 14种作物
- 数据源: USDA Cropland Data Layer
-
EnMAP-CORINE (欧洲土地覆盖分类)
- 类别: 19类
- 数据源: CORINE Land Cover Map
-
EnMAP-EuroCrops (欧洲作物类型分割)
- 类别: 15类
- 数据源: EuroCrops dataset
分割任务
-
EnMAP-NLCD (美国土地覆盖分割)
- 类别: 15类
- 数据源: National Land Cover Database (NLCD)
-
EnMAP-BDForet (法国树种分割)
- 类别: 12种树种
- 数据源: IGN BDForêt V2 dataset
-
EnMAP-TreeMap (美国树种分割)
- 数据源: US TreeMap dataset
-
EnMAP-BNETD (象牙海岸土地覆盖分割)
- 类别: 10类
- 数据源: BNETD Land Cover Map
跨传感器基准
- DESIS-CDL / EO-1-CDL (美国作物类型分割)
- 传感器: DESIS 和 Hyperion EO-1
回归任务
- Hyperview (土壤特性回归)
- 数据源: Hyperview Challenge
预训练模型
- 下载地址: syncandshare.desy.de
模型列表
| 模型名称 | 预训练算法 | 参数量 |
|---|---|---|
| Spec. RN50 | MoCo-V2, DINO | ~23M |
| Spec. ViT-S | MoCo-V2, DINO, MAE | ~22M |
| Spec. ViT-B | MAE | ~86M |
| Spec. ViT-L | MAE | ~304M |
| Spec. ViT-H | MAE | ~630M |
| Spec. ViT-g | MAE | ~1.8B |
引用
bibtex @article{braham2024spectralearth, title={SpectralEarth: Training Hyperspectral Foundation Models at Scale}, author={Braham, Nassim Ait Ali and Albrecht, Conrad M and Mairal, Julien and Chanussot, Jocelyn and Wang, Yi and Zhu, Xiao Xiang}, journal={arXiv preprint arXiv:2408.08447}, year={2024} }
搜集汇总
数据集介绍

构建方式
Spectral Earth数据集依托EnMAP卫星任务构建,覆盖多样化的地理区域,包含约3.3TB的高光谱影像数据。该数据集通过整合多源遥感数据,如USDA Cropland Data Layer、CORINE Land Cover Map等,构建了一系列下游任务,涵盖作物类型分类、土地覆盖分类、树种分割等多个应用场景。数据预处理过程包括影像归一化、地理配准和类别标注,确保了数据的准确性和一致性。
特点
Spectral Earth数据集以其大规模和高光谱分辨率著称,提供了丰富的空间和光谱信息。数据集涵盖全球多个地理区域,具有高度的多样性和代表性,适用于跨区域模型验证。此外,数据集支持多种下游任务,包括分类、分割和回归,为高光谱遥感研究提供了全面的基准。其预训练模型涵盖不同规模的视觉Transformer架构,为研究者提供了灵活的模型选择。
使用方法
使用Spectral Earth数据集需通过DLR GeoService Portal申请下载。数据集配套的代码库基于Hydra配置管理,支持灵活的参数调整和实验管理。用户可通过命令行覆盖配置参数,如学习率、批次大小等,以适应不同的实验需求。预训练模型可直接用于下游任务,或通过微调适配特定应用场景。代码库提供了详细的数据加载、模型训练和评估流程,便于研究者快速开展实验。
背景与挑战
背景概述
Spectral Earth数据集是2024年由Nassim Ait Ali Braham等研究人员基于EnMAP卫星任务数据构建的大规模高光谱遥感数据集,旨在推动高光谱基础模型的预训练研究。该数据集覆盖全球多样化的地理区域,包含约3.3TB的高光谱影像数据,支持农作物分类、土地覆盖识别、树种分割等下游任务。作为高光谱遥感领域的重要基准,其创新性地将自监督学习范式引入遥感影像分析,为环境监测、精准农业等应用提供了新的研究范式。数据集依托德国宇航中心(DLR)的GeoService平台发布,体现了航天遥感与人工智能的跨学科融合趋势。
当前挑战
高光谱影像固有的高维特性导致模型面临维度灾难和光谱冗余的挑战,需开发高效的特征提取方法。数据采集受大气条件、传感器噪声等因素干扰,影像质量存在空间分辨率与光谱保真度的权衡问题。跨区域应用时,地表覆盖物光谱特征的时空异质性增加了模型泛化难度。在构建过程中,多源异构数据(如USDA CDL、CORINE等)的标准化处理涉及复杂的坐标转换与标签映射,而3.3TB原始数据的存储与计算对分布式处理架构提出了苛刻要求。不同下游任务(如分类与回归)的评估指标差异也使得统一模型性能衡量变得复杂。
常用场景
经典使用场景
在遥感科学与地球观测领域,Spectral Earth数据集通过EnMAP卫星任务采集的大规模高光谱影像,为研究者提供了丰富的多光谱波段信息。该数据集广泛应用于农作物分类、土地覆盖制图及树种识别等任务,其高分辨率的光谱特征使得精细化的地物分类成为可能。特别是在农业监测中,通过分析不同作物的光谱反射特性,实现了高精度的作物类型识别与生长状态评估。
解决学术问题
Spectral Earth数据集解决了高光谱遥感影像预训练模型数据稀缺的学术难题,为构建通用型高光谱基础模型提供了关键支持。其覆盖的多样化地理区域和多任务评估框架,显著提升了模型在跨区域、跨传感器场景下的泛化能力。该数据集通过整合EnMAP-CDL、EnMAP-CORINE等下游任务,推动了高光谱影像在语义分割、多标签分类等方向的方法创新,填补了传统方法在复杂地表覆盖解析上的技术空白。
衍生相关工作
围绕该数据集衍生的经典工作包括基于MoCo-V2和DINO算法的自监督预训练框架,以及针对高光谱特性优化的ViT架构。论文提出的MAE模块在掩码光谱重建任务中取得突破,相关方法已被拓展应用于Hyperview土壤属性回归挑战。跨传感器基准测试DESIS-CDL的研究成果,进一步推动了多源遥感数据融合的技术发展。
以上内容由遇见数据集搜集并总结生成



