five

rebase-energy/low-to-high-res_weather_from_topography

收藏
Hugging Face2024-06-14 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/rebase-energy/low-to-high-res_weather_from_topography
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集旨在通过地形数据将低分辨率天气预报转换为高分辨率天气预报。数据集包含三种类型的数据:历史天气观测数据(来自SMHI观测站)、历史低分辨率天气预报数据(来自ECMWF网格点)以及地形/高程数据(来自Copernicus DEM GLO-30)。这些数据用于构建模型,将ECMWF点的天气预报与地形数据结合,生成高分辨率天气预报,并使用SMHI的天气观测数据作为稀疏评估点。

该数据集旨在通过地形数据将低分辨率天气预报转换为高分辨率天气预报。数据集包含三种类型的数据:历史天气观测数据(来自SMHI观测站)、历史低分辨率天气预报数据(来自ECMWF网格点)以及地形/高程数据(来自Copernicus DEM GLO-30)。这些数据用于构建模型,将ECMWF点的天气预报与地形数据结合,生成高分辨率天气预报,并使用SMHI的天气观测数据作为稀疏评估点。
提供机构:
rebase-energy
原始信息汇总

数据集概述:基于地形的高分辨率天气预报

数据集描述

该数据集旨在通过地形数据将低分辨率天气预报转换/插值为高分辨率。数据集包含以下三种类型的数据:

  1. 历史天气观测数据(SMHI)

    • 来自选定SMHI观测站(评估点)的历史天气观测数据。
  2. 历史低分辨率天气预报(ECMWF)

    • 对于每个SMHI站点,来自最近的四个ECMWF网格点的历史低分辨率天气预报。
  3. 地形/海拔数据(Copernicus DEM GLO-30)

    • 围绕每个SMHI站点的地形/海拔数据,由四个ECMWF点包围的网格。

数据集用途

数据集用于支持以下模型流程:

  • 结合四个邻近ECMWF点的天气预报和地形/海拔数据,生成高分辨率预报网格。
  • 使用SMHI天气观测数据作为生成的高分辨率预报的稀疏评估点。

数据格式与示例

SMHI天气观测数据

  • 结构:CSV文件,每个天气参数和观测站单独文件。
  • 示例: csv Datum;Tid (UTC);Lufttemperatur;Kvalitet 2020-01-01;06:00:00;-2.2;G ...

ECMWF历史天气预报

  • 结构:包含多个预报天气变量,每个SMHI观测站周围四个最近的网格点。

  • 示例:

    <xarray.Dataset> ...

地形数据

  • 结构:围绕每个SMHI站点的地形数据块,每个块约361x361点,覆盖0.1°x0.1°区域。

  • 示例:

    ...

数据集许可证

搜集汇总
数据集介绍
main_image_url
构建方式
在气象预报领域,提升空间分辨率是改善局部天气预测精度的关键挑战。该数据集专为利用地形数据将低分辨率气象预报转换为高分辨率预报而设计,整合了三类核心数据源:瑞典气象水文研究所(SMHI)的历史观测数据、欧洲中期天气预报中心(ECMWF)的低分辨率历史预报数据,以及哥白尼数字高程模型(Copernicus DEM GLO-30)的地形数据。具体构建时,针对每个SMHI观测站点,提取其周围最近的4个ECMWF网格点的预报变量,并同步裁剪该区域的地形高程数据,同时计算各ECMWF网格点周围±0.05弧度的平均海拔。所有数据以站点为索引,分别存储为CSV文件、NetCDF格式的Xarray数据集和地形分块文件,形成结构化的多源融合数据集。
特点
该数据集的核心特点在于其多模态数据融合与空间映射的独特性。它将稀疏的站点观测、粗分辨率网格预报与高分辨率地形信息有机耦合,每个样本均包含4个ECMWF格点的6种气象变量(如温度、风速、气压等)、对应区域约361×361点的精细地形格网,以及站点实况观测作为验证基准。数据覆盖瑞典全境275个观测站点,时间跨度从2020年起,预报时效长达54小时。地形数据的分辨率达30米,显著高于气象预报网格,为空间降尺度提供了关键的物理约束。此外,数据集采用统一的站点索引进行对齐,便于批量处理与模型训练。
使用方法
该数据集的使用需依托Python科学计算生态。首先通过conda或mamba创建包含pandas、xarray、dask和netCDF4的环境。加载时,以站点索引为入口,通过pandas读取SMHI观测CSV文件,利用xarray的open_dataset函数加载ECMWF预报NetCDF数据,并同样以xarray读取对应站点的地形分块NetCDF文件。此外,通过pickle加载预计算的ECMWF格点平均高程数据。用户可将4个ECMWF格点的预报变量与地形格网拼接,构建输入特征,以SMHI观测值作为目标标签,训练用于空间插值或超分辨率的深度学习模型。数据已按参数和站点分文件存储,便于灵活选取特定变量或区域进行实验。
背景与挑战
背景概述
该数据集由瑞典气象水文研究所(SMHI)主导的OWGRE项目于近年开发,聚焦于利用地形数据提升数值天气预报的空间分辨率。核心研究问题在于如何将欧洲中期天气预报中心(ECMWF)提供的低分辨率全球预报场,通过融合高精度地形信息(Copernicus DEM GLO-30),转化为能够捕捉局地气象特征的精细化预测。数据集整合了SMHI观测站的历史气象记录、ECMWF四点格点预报以及地形高程数据,为构建从粗网格到细网格的降尺度模型提供了标准化基准。其影响力体现在为气候研究领域提供了一种可复现的数据驱动方法,突破传统动力降尺度对计算资源的依赖,推动了机器学习在气象超分辨率任务中的工程化应用。
当前挑战
数据集面临的挑战主要体现为:其一,在领域问题层面,低分辨率预报到高分辨率观测之间存在显著的尺度鸿沟,ECMWF格点(约9公里)与SMHI站点观测之间的空间不匹配要求模型具备跨尺度特征映射能力,同时需处理地形对局地气象要素(如温度、风速)的非线性调制效应;其二,在构建过程中,多源异构数据的时空对齐存在困难——ECMWF预报场与SMHI观测的时间分辨率不一致(前者为6小时间隔,后者为3小时间隔),且地形数据需精确裁剪至以ECMWF格点为边界的非规则区域,导致边界处出现数据缺失(NaN值)。此外,不同数据源的许可协议(如CC BY 4.0与Copernicus专用许可)增加了合规使用的复杂性,而稀疏的观测站点仅能作为验证点,难以全面评估高分辨率重建结果的空间连续性。
常用场景
经典使用场景
该数据集专为利用地形数据将低分辨率气象预报提升至高分辨率而设计,是气象学中降尺度与空间插值研究的经典范例。其核心场景在于,通过整合ECMWF提供的四个邻近网格点的粗粒度预报变量(如温度、风速、气压),结合Copernicus DEM GLO-30的高程数据,构建能够输出精细网格预报的机器学习模型。SMHI观测站的历史数据则作为稀疏验证点,用于评估生成的高分辨率预报的准确性,从而形成从输入到验证的完整闭环。这一框架广泛应用于气象超分辨率任务,尤其在地形复杂区域中,模型需学习地形起伏对局地微气候的调制效应,以实现精准的空间细化。
解决学术问题
该数据集直面气象学中粗分辨率预报与局地精度需求之间的鸿沟,解决了传统统计降尺度方法难以捕捉地形非线性影响的学术难题。通过提供多源异构数据(低分辨率预报、地形高程、稀疏观测),它支持研究者探索深度学习模型(如卷积神经网络或图神经网络)如何从地形特征中提取局部气象模式,从而提升预报的空间细节。其意义在于,推动了物理引导的机器学习方法在气象学中的应用,使得在观测站点稀疏的山区或沿海区域,也能生成接近真实的高分辨率场。这一贡献为理解地形-大气相互作用提供了数据基础,并促进了可解释性气象模型的发展。
衍生相关工作
该数据集衍生的经典工作主要集中在物理-统计混合建模与生成式气象预报领域。典型方向包括:利用地形作为条件输入的对抗生成网络(GAN)进行超分辨率重建,以生成更逼真的高分辨率场;基于图神经网络(GNN)的网格插值方法,通过建模ECMWF点与地形网格间的空间关系,提升预测的物理一致性。此外,该数据促进了迁移学习研究,即将在瑞典区域预训练的模型微调至其他地形相似地区。这些工作不仅验证了地形信息在降尺度中的有效性,还推动了气象数据同化技术的革新,为未来全数据驱动的区域气候模拟奠定了方法论基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作