five

Weather2K

收藏
arXiv2023-02-21 更新2024-07-30 收录
下载链接:
https://github.com/bycnfz/weather2k/
下载链接
链接失效反馈
官方服务:
资源简介:
Weather2K是一个多变量的时空基准数据集,用于气象预报,基于来自地面气象站的实时观测数据。该数据集具有实时性、可靠性和多样性,包含20个气象因素和3个位置信息常数,共有40,896个时间步长。

Weather2K is a multivariate spatiotemporal benchmark dataset for weather forecasting, based on real-time observational data from ground meteorological stations. This dataset features real-time performance, reliability and diversity, including 20 meteorological factors and 3 location information constants, with a total of 40,896 time steps.
创建时间:
2023-02-21
搜集汇总
数据集介绍
main_image_url
构建方式
Weather2K数据集的构建基于中国气象局地面气象站的实时观测数据。数据从2130个地面气象站收集,覆盖了600万平方公里的区域,每小时更新一次。数据集包括20个重要的近地表气象因素和3个时间不变的常量,以提供位置信息。数据的时间跨度为从2017年1月到2021年8月,共40896个时间步长。数据收集过程中,进行了严格的质量控制,包括数值范围检查、气候范围检查、主要变化范围检查、内部一致性检查、时间一致性检查和空间一致性检查,以确保数据的准确性和可靠性。
特点
Weather2K数据集的特点包括:1)可靠性和实时性:数据每小时从2130个地面气象站收集,并经过严格的质量控制,保证了数据的准确性和可靠性。2)多元气象变量:数据集提供了20个重要的近地表气象因素和3个时间不变的常量,以提供位置信息。3)适用性广泛:数据集适用于时间序列预测和时空预测等多种任务。
使用方法
Weather2K数据集的使用方法如下:1)数据预处理:首先对数据进行清洗和筛选,包括数值范围检查、气候范围检查、主要变化范围检查、内部一致性检查、时间一致性检查和空间一致性检查,以确保数据的准确性和可靠性。2)数据分割:将数据分割为训练集、验证集和测试集,以便进行模型训练和评估。3)模型训练:使用Transformer、GNN等深度学习模型进行时间序列预测和时空预测。4)模型评估:使用均方误差(MSE)和平均绝对误差(MAE)等指标评估模型的预测性能。
背景与挑战
背景概述
气象预报是气象工作的基石之一。近年来,随着数据驱动方法的兴起,特别是深度学习在气象预报任务中的应用取得了显著的突破。为了推动气象预报任务的发展,研究者们迫切需要高质量的基准数据集。然而,现有的气象预报数据集在实时性、可靠性和多样性方面存在不足。为此,研究者们提出了一个新的基准数据集Weather2K,旨在解决这些问题。Weather2K数据集收集了中国气象局2,130个地面气象站的实时观测数据,覆盖了超过600万平方公里的区域。数据集包含20个气象因素和3个位置信息常量,时间跨度为40,896个时间步长。Weather2K数据集的创建旨在推动气象预报任务的发展,并为研究人员提供高质量的数据资源。
当前挑战
Weather2K数据集面临着一些挑战。首先,气象预报任务的挑战在于如何准确地预测复杂的气象变化。其次,构建气象预报数据集的挑战在于如何确保数据的实时性、可靠性和多样性。Weather2K数据集通过收集地面气象站的实时观测数据,并经过严格的质量控制,旨在解决这些问题。此外,Weather2K数据集还面临着如何有效利用多变量气象因素的挑战。为了解决这个问题,研究者们提出了Meteorological Factors based Multi-Graph Convolution Network (MFMGCN)模型,该模型通过结合静态图和动态图,有效地构建了地理位置之间的内在相关性。实验结果表明,MFMGCN模型在Weather2K数据集上取得了显著的预报性能提升和时序鲁棒性。
常用场景
经典使用场景
Weather2K数据集是一个多变量时空基准数据集,旨在通过地面气象站实时观测数据来弥补现有天气预报数据集在实时性、可靠性和多样性方面的不足。该数据集的特点包括:1)可靠和实时的数据,每小时从2,130个地面气象站收集,覆盖6百万平方公里的区域;2)多变量气象变量,提供20个气象因素和3个位置信息常数,时间步长为40,896;3)适用于各种任务,包括时间序列预测和时空预测。
实际应用
Weather2K数据集在实际应用中具有广泛的应用前景,包括:1)气象预报,用于预测未来天气状况,为交通、旅游、农业和能源等行业提供决策支持;2)灾害预警,用于预测和监测极端天气事件,如台风、洪水等;3)气候变化研究,用于分析气候变化的趋势和影响。此外,Weather2K数据集还可以用于开发智能气象应用程序,为公众提供准确的天气预报服务。
衍生相关工作
Weather2K数据集的发布促进了相关领域的研究,衍生了许多经典工作。例如,基于Weather2K数据集,研究人员提出了Meteorological Factors based Multi-Graph Convolution Network (MFMGCN),该模型有效地构建了基于气象因素的地域相关性,并提高了预报性能和时序鲁棒性。此外,Weather2K数据集还推动了时空图神经网络的研究,为气象预报任务提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作