CarbonBench

Name: CarbonBench
Creator: 明尼苏达大学
Published: 2026-03-11 00:33:28
License: 暂无描述

arXiv2026-03-11 更新2026-03-12 收录

下载链接：

https://github.com/alexxxroz/CarbonBench

下载链接

链接失效反馈

官方服务：

资源简介：

CarbonBench是由明尼苏达大学团队构建的全球首个零样本空间迁移学习的碳通量升尺度基准数据集，涵盖2000至2024年间567个通量塔站点的130万条日观测记录。该数据集整合了标准化遥感与气象特征，通过分层评估协议（按植被类型和气候带划分）严格测试模型在未观测生态系统的泛化能力，其核心价值在于解决地球系统科学中碳通量空间异质性建模难题。数据集支持从传统树方法到元学习架构的基线比较，旨在推动气候变化研究与机器学习领域交叉创新，特别针对热带和高纬度等关键碳循环区域的预测空白。

CarbonBench is the world's first benchmark dataset for zero-shot spatial transfer learning of carbon flux upscaling, developed by a research team at the University of Minnesota. It encompasses 1.3 million daily observational records from 567 flux tower sites spanning the years 2000 to 2024. This dataset integrates standardized remote sensing and meteorological features, and employs a stratified evaluation protocol (partitioned by vegetation type and climate zone) to rigorously test the generalization capability of models in unobserved ecosystems. Its core value lies in addressing the challenge of modeling spatial heterogeneity of carbon fluxes in Earth system science. The dataset supports baseline comparisons ranging from traditional tree-based methods to meta-learning architectures, and aims to promote interdisciplinary innovation between climate change research and machine learning, specifically targeting prediction gaps in key carbon cycle regions such as tropical and high-latitude areas.

提供机构：

明尼苏达大学

创建时间：

2026-03-11

原始信息汇总

CarbonBench 数据集概述

数据集简介

CarbonBench 是一个用于评估零样本学习在碳通量升尺度应用中性能的全球基准数据集。它包含来自全球 567 个涡度协方差通量塔站点（2000-2024年）的超过 130 万条日尺度观测数据。该数据集提供了分层的评估协议、一套标准化的遥感与气象特征，以及可复现的基线模型。

预测目标

所有目标变量均基于 ONEFlux 方法标准化的涡度协方差测量值：

GPP (GPP_NT_VUT_USTAR50)：总初级生产力
RECO (RECO_NT_VUT_USTAR50)：生态系统呼吸
NEE (NEE_VUT_USTAR50)：净生态系统交换量（NEE = -GPP + RECO）每个观测包含一个连续的质量控制标志（NEE_VUT_USTAR50_QC，范围 0-1）。

特征变量

来源	变量数量	描述
MOD09GA	12	7个地表反射波段、传感器/太阳几何信息、云量分数
ERA5-Land	6 / 36 / 150	最小、标准或完整的气象特征集
站点元数据	2 + 3 分类	纬度、经度、IGBP植被类型、柯本气候分类

所有特征均按站点统一为日分辨率。

训练-测试划分

数据集提供了两种互补的、基于站点保留的分层划分，用于零样本评估：

IGBP 分层划分：按植被类型（16类）划分。常见类别采用 80/20 划分，稀有类别（≤10个站点）采用 50/50 划分。
柯本气候分层划分：按气候区（5类）划分。统一采用 80/20 划分。

基线模型

数据集涵盖以下类别的基线模型：

基于树的方法：XGBoost, LightGBM
循环神经网络：LSTM, CT-LSTM, GRU, CT-GRU
Transformer：Encoder-only Transformer, Patch-Transformer
元学习：TAM-RL

评估指标

所有指标均按站点计算，然后报告其分位数（第25、中位、第75百分位数）：

R²：决定系数
RMSE：均方根误差（单位：gC m⁻² day⁻¹）
nMAE：用站点平均通量归一化的平均绝对误差
RAE：相对绝对误差（R² 的 L1 类比）

数据获取与使用

数据可通过 Hugging Face 获取：https://huggingface.co/datasets/alexroz/CarbonBench 推荐从示例笔记本 examples/workflow_example.ipynb 开始，了解完整的数据加载、特征处理、模型训练与评估流程。

引用

（论文引用信息已在 README 中提供，但当前为注释状态）

许可证

MIT 许可证

搜集汇总

数据集介绍

构建方式

在全球碳通量估算领域，涡度协方差观测因地理分布稀疏而难以支撑连续空间预测。CarbonBench通过整合全球567个通量塔站点（2000-2024年）的超过130万条日尺度观测数据，构建了首个面向零样本空间迁移学习的碳通量升尺度基准。数据集融合了来自FLUXNET、AmeriFlux等网络的标准化通量数据（GPP、RECO、NEE），并配以MODIS遥感反射率波段与ERA5-Land再分析气象驱动因子，形成时空对齐的多模态特征集合。数据经过严格的质控与间隙填充处理，并依据IGBP植被类型与Köppen气候分类进行双重分层划分，确保训练集与测试集在生态系统和气候维度上具有代表性，从而系统评估模型在未见地理区域的泛化能力。

使用方法

使用CarbonBench时，研究者可通过其配套Python库加载经过标准化的时空序列数据，并依据预设的IGBP或Köppen分层划分方案构建零样本迁移实验。模型需在训练集站点上学习从气象与遥感特征到碳通量的映射关系，而后在完全未参与训练的地理站点上进行预测。评估阶段采用针对回归任务设计的R²、RMSE及标准化平均绝对误差等指标，并强调对低代表性生态区域（如热带或极地气候）的性能分析。该框架支持静态模型与时间序列模型的对比，同时允许扩展域泛化、对抗训练等先进迁移学习方法，以探索碳通量估算中的跨区域泛化机制。

背景与挑战

背景概述

在应对全球气候变化的科学探索中，精确量化陆地碳通量是制定气候政策和进行碳核算的基石。然而，受限于涡度协方差观测站点地理分布稀疏、建设与维护成本高昂，现有模型在代表性不足的生态系统（如热带雨林和高纬度地区）中泛化能力面临严峻考验。为系统评估模型在零样本空间迁移学习场景下的性能，明尼苏达大学的研究团队于2024年发布了CarbonBench基准数据集。该数据集整合了全球567个通量塔站点自2000年至2024年超过130万条日尺度观测数据，并提供了标准化的遥感与气象特征。其核心研究目标在于构建一个严谨的评估框架，以测试模型在未见植被类型与气候区划下的泛化能力，从而弥合机器学习方法与地球系统科学之间的鸿沟，推动下一代气候模型的发展。

当前挑战

CarbonBench旨在解决的领域核心挑战是陆地碳通量空间升尺度问题，即如何从稀疏的点位观测数据中，精确推断出全球连续空间的碳通量场。这本质上是一个零样本时空序列回归问题，模型必须能够迁移到气候特征、植被类型完全不同的新地理区域。具体挑战包括：模型需克服强烈的空间异质性，即相同环境驱动因子在不同地域可能对应截然不同的碳通量响应；同时，观测覆盖存在严重不平衡，对全球碳循环至关重要的热带和高纬度生态系统恰恰是数据最稀疏的区域。在数据集构建过程中，挑战主要源于数据源的异构性与质量控制的复杂性。需要将来自FLUXNET、AmeriFlux等多个网络的涡度协方差数据进行标准化处理，并与MODIS遥感数据、ERA5-Land再分析气象数据在时空尺度上进行精确对齐与融合。此外，设计能够有效分离空间迁移能力与时间自相关性的分层评估协议，以及处理不同生态系统和气候区之间严重的样本数量不平衡，均是构建过程中需要解决的关键难题。

常用场景

经典使用场景

在陆地碳循环研究中，CarbonBench数据集被广泛应用于零样本空间迁移学习的基准测试。该数据集整合了全球567个通量塔站点超过130万条日尺度观测数据，结合遥感与气象特征，为模型提供了评估其在未见植被类型与气候区划下泛化能力的标准化平台。研究者利用其分层评估协议，能够系统比较不同机器学习架构在碳通量升尺度任务中的表现，从而推动跨生态系统碳交换预测的精准化。

解决学术问题

CarbonBench致力于解决碳通量升尺度研究中因观测稀疏导致的模型泛化难题。通过构建零样本空间迁移学习框架，该数据集使研究者能够评估模型在分布偏移下的回归性能，弥补了传统时间序列预测基准缺乏空间泛化评估的空白。其意义在于为地球系统科学与机器学习交叉领域提供了首个标准化测试平台，促进了迁移学习方法在生态建模中的系统比较与创新。

实际应用

在实际应用中，CarbonBench为全球碳收支评估与气候政策制定提供了关键数据支撑。基于该数据集训练的模型可生成高分辨率网格化碳通量产品，用于校准地球系统模型，提升碳汇估算的可靠性。此外，其在农业碳管理、生态系统服务评估等领域的应用，有助于优化土地利用策略，支持碳中和目标的科学决策。

数据集最近研究