PeakWeather
收藏arXiv2025-06-17 更新2025-06-19 收录
下载链接:
https://huggingface.co/datasets/peakweather
下载链接
链接失效反馈官方服务:
资源简介:
PeakWeather是一个高质量的地面气象观测数据集,由瑞士联邦气象和气候办公室的SwissMetNet网络收集。该数据集包括来自302个站点的多样化气象变量,时间分辨率为每10分钟,时间跨度超过8年。数据集还包括从数字高程模型中提取的地形描述符,以提供上下文信息。PeakWeather旨在支持广泛的空间时间任务,包括不同规模的时间序列预测、图结构学习、插值和虚拟传感。该数据集还包括来自当前运行的高分辨率数值天气预测模型的集合预报,作为评估新方法的基准预报。
PeakWeather is a high-quality surface meteorological observation dataset collected by the SwissMetNet network of the Swiss Federal Office of Meteorology and Climatology. This dataset includes diverse meteorological variables from 302 monitoring stations, with a temporal resolution of 10 minutes and a time span of over 8 years. It also includes topographic descriptors extracted from digital elevation models to provide contextual information. PeakWeather aims to support a wide range of spatiotemporal tasks, including time series forecasting at various scales, graph structure learning, interpolation, and virtual sensing. Additionally, the dataset provides ensemble forecasts from currently operational high-resolution numerical weather prediction models, which serve as baseline forecasts for evaluating novel methodologies.
提供机构:
瑞士联邦气象和气候办公室
创建时间:
2025-06-17
搜集汇总
数据集介绍

构建方式
PeakWeather数据集构建基于瑞士气象局MeteoSwiss运营的SwissMetNet自动气象站网络,覆盖瑞士复杂地形中的302个站点。数据采集自2017年1月至2025年3月,时间分辨率为10分钟,包含温度、湿度、降水等8种气象变量。数据集通过数字高程模型提取地形特征,并整合了高分辨率数值天气预报模型ICON-CH1-EPS的集合预报作为基准参考。所有观测数据经过自动和人工双重质量控制,传感器位移等元数据被完整记录以确保透明度。
特点
该数据集的核心价值在于其时空密集性及多模态整合:10分钟高频采样持续8年,形成超过40亿数据点的长时序记录;302个站点平均间距18公里,在阿尔卑斯山区形成独特的三维观测网络;气象变量与50米分辨率地形描述符的耦合,为研究局地气象-地形相互作用提供了可能。作为首个公开融合实测数据、地形特征与业务NWP预报的基准,其复杂性体现在瑞士地形导致的非平稳时空相关性,以及气象变量随海拔高度呈现的强异质性。
使用方法
PeakWeather通过Hugging Face平台提供结构化访问,配套Python库支持数据加载、对齐及预处理。典型应用包括:1)时空预测任务,如将24小时历史观测窗口通过STGNN模型预测未来风速;2)虚拟传感,利用图结构学习填补无观测区域的缺失数据;3)多任务联合学习,同步处理气象变量预测与地形特征嵌入。实验表明,在0-12小时短临预报中,数据驱动模型可超越NWP基准,而地形特征的引入使风速预测MAE降低7.2%。
背景与挑战
背景概述
PeakWeather数据集由瑞士南部大学(Università della Svizzera italiana)与瑞士联邦气象与气候办公室(MeteoSwiss)联合研发,于2025年6月通过论文正式发布。该数据集收录了瑞士境内302个气象站点自2017年1月至2025年3月的高频观测数据,时间分辨率达10分钟,涵盖温度、湿度、降水等8类核心气象变量。其创新性在于融合了数字高程模型生成的地形描述符,并附赠当前最先进的数值天气预报模型ICON-CH1-EPS的集合预报结果,为时空深度学习研究提供了多模态基准。该数据集通过支持直接观测预测(DOP)范式,推动了不依赖数值天气预报的端到端气象建模研究,对可再生能源调度、极端天气预警等应用领域具有重要价值。
当前挑战
PeakWeather需应对双重挑战:在领域问题层面,瑞士复杂地形导致的气象变量非线性时空关联对建模提出极高要求,特别是风速预测受局地地形遮蔽效应影响显著;在构建技术层面,302个站点传感器配置差异导致3%数据缺失,且部分站点存在139米内的微小位移,需开发鲁棒的数据对齐与插值方法。此外,1公里网格的数值天气预报与站点实测数据的空间尺度不匹配问题,以及10分钟高频数据带来的计算存储压力,均为该数据集构建过程中的关键技术瓶颈。
常用场景
经典使用场景
PeakWeather数据集在气象学和时空深度学习领域具有广泛的应用价值。其高分辨率的地面气象观测数据,结合复杂地形下的时空依赖性,为研究者提供了一个理想的实验平台。经典使用场景包括时间序列预测、图结构学习、数据插补和虚拟传感等任务。特别是在风速和风向预测方面,该数据集通过整合历史观测数据和地形特征,能够显著提升预测精度。
解决学术问题
PeakWeather数据集解决了气象预测中多个关键学术问题。首先,它通过提供高频率、长时间跨度的观测数据,支持了直接观测预测(DOP)方法的研究,减少了对数值天气预报(NWP)的依赖。其次,数据集中的地形描述符和气象变量相结合,有助于研究复杂地形对气象过程的影响。此外,该数据集还解决了时空依赖性建模中的挑战,为图神经网络等先进算法提供了验证平台。
衍生相关工作
PeakWeather数据集已经衍生出多项经典研究工作。例如,基于该数据集的时空图神经网络(STGNN)在风速预测任务中表现出色,显著优于传统的循环神经网络(RNN)。此外,一些研究利用该数据集探索了图结构学习在气象预测中的应用,进一步推动了数据驱动方法的发展。这些工作不仅验证了数据集的实用性,还为未来的研究提供了重要参考。
以上内容由遇见数据集搜集并总结生成



