Open-Canopy dataset

Name: Open-Canopy dataset
Creator: Universiti Malaya, Kuala Lumpur
Published: 2025-04-18 11:48:04
License: 暂无描述

arXiv2025-04-18 更新2025-04-22 收录

下载链接：

https://github.com/YuZhenyuLindy/SatelliteCalculator

下载链接

链接失效反馈

官方服务：

资源简介：

Open-Canopy数据集是由Universiti Malaya创建的大型遥感数据集，包含超过一百万对样本，跨越八个核心生态指标。该数据集基于物理定义的指数公式合成，用于定量遥感反演任务。数据集涵盖了高分辨率的Sentinel-2卫星图像和八个生态变量的地面真实值，包括植被指数、树冠高度、地上生物量等。

The Open-Canopy dataset is a large-scale remote sensing dataset developed by Universiti Malaya, comprising over one million sample pairs and covering eight core ecological metrics. Synthesized using physically defined exponential formulas, this dataset is tailored for quantitative remote sensing inversion tasks. It includes high-resolution Sentinel-2 satellite imagery and ground truth values for eight ecological variables, such as vegetation index, canopy height, above-ground biomass, and the like.

提供机构：

Universiti Malaya, Kuala Lumpur

创建时间：

2025-04-18

搜集汇总

数据集介绍

构建方式

Open-Canopy数据集通过整合Sentinel-2卫星的多光谱影像与机载LiDAR数据构建而成，覆盖法国境内超过87,000平方公里的开放森林区域。该数据集创新性地采用物理定义的植被指数公式，自动生成包含五个光谱指数（NDVI、GNDVI、SAVI、EVI、NDWI）和三个结构变量（冠层高度、地上生物量、碳储量）的百万级样本对，实现了生态参数与遥感影像的物理一致性对齐。数据构建过程中严格遵循辐射传输模型原理，通过区域校准的异速生长方程将LiDAR衍生的冠层高度转化为生物量参数，确保标注数据的科学可靠性。

使用方法

该数据集支持端到端的多任务深度学习框架应用，典型流程包括：输入四波段Sentinel-2影像（蓝、绿、红、近红外）经Swin Transformer主干网络提取共享特征，通过任务提示嵌入层动态生成NDVI等生态变量的查询向量，利用交叉注意力适配器实现特征调制，最终由轻量级MLP解码器输出空间连续的反演结果。使用时应遵循论文建议的数据划分策略，训练时采用随机裁剪至224×224像素并施加尺度旋转增强，优化使用L1损失函数配合动态学习率调度，重点评估RMSE、R2等回归指标在植被掩膜区域的表现。

背景与挑战

背景概述

Open-Canopy数据集由法国国家科学研究中心（CNRS）与多家研究机构于2024年联合发布，旨在为森林生态系统监测提供高分辨率遥感基准数据。该数据集覆盖法国境内87,000平方公里区域，整合了1.5米分辨率的Sentinel-2多光谱影像与机载LiDAR衍生的冠层高度数据，开创性地实现了光谱特征与三维结构参数的协同标注。核心研究聚焦于解决开放林区生态参数的反演难题，通过物理公式自动生成百万级样本，支持NDVI、冠层高度、生物量等八类生态指标的联合估测，为定量遥感领域提供了首个多任务联合学习的标准化评估框架。其创新性的数据构建范式显著推动了植被参数反演从传统经验模型向数据驱动范式的转型。

当前挑战

在领域问题层面，Open-Canopy需应对多光谱数据与连续变量回归的双重挑战：Sentinel-2的蓝、绿、红、近红外四波段特征存在非线性耦合，而结构参数（如生物量）的反演需克服小样本条件下物理一致性约束与数据驱动建模的冲突。数据构建过程中，LiDAR与光学影像的时空配准误差需控制在亚像素级，且植被指数公式的物理约束导致样本分布呈现非高斯特性。此外，法国南北部森林类型差异引发的域偏移问题，要求数据集在空间覆盖上保持生态代表性，这些因素共同构成了该数据集在算法泛化性与物理可解释性方面的核心挑战。

常用场景

经典使用场景

Open-Canopy数据集在定量遥感反演领域具有广泛的应用，特别是在森林监测和生态变量估计方面。该数据集通过结合高分辨率Sentinel-2卫星影像和LiDAR数据，为植被指数（如NDVI、GNDVI）和结构变量（如冠层高度、地上生物量）的估计提供了高质量的标注数据。其经典使用场景包括多任务学习框架下的生态变量联合估计，为定量遥感反演任务提供了统一的基准。

解决学术问题

Open-Canopy数据集解决了定量遥感反演中的多个关键学术问题。首先，它通过物理定义的指数公式自动生成大规模标注数据，缓解了传统方法中标注数据稀缺的问题。其次，数据集支持多任务学习，使得模型能够同时估计多种生态变量，如植被指数和结构参数，从而提高了模型的泛化能力和效率。此外，该数据集为遥感领域的基础模型研究提供了重要支持，填补了定量反演任务中基础模型的空白。

实际应用

在实际应用中，Open-Canopy数据集被广泛用于森林资源管理、碳储量估算和环境监测等领域。例如，通过该数据集训练的模型可以准确估计森林冠层高度和地上生物量，为林业部门和环保机构提供科学依据。此外，数据集的多光谱特性使其适用于农业监测和水资源管理，帮助优化农作物生长和灌溉策略。其高分辨率和多任务特性为实际场景中的复杂生态问题提供了可靠的解决方案。

数据集最近研究