five

dmi-aarhus-weather-data

收藏
Hugging Face2026-03-09 更新2026-03-10 收录
下载链接:
https://huggingface.co/datasets/Ciroc0/dmi-aarhus-weather-data
下载链接
链接失效反馈
官方服务:
资源简介:
DMI Aarhus气象数据集包含丹麦奥胡斯地区的历史天气预报和实际观测数据。数据集主要文件包括合并预报与观测特征的训练矩阵(training_matrix.parquet)、模型注册表(model_registry.json)、训练元数据(model_meta.json)以及各目标的模型包(*_models.pkl)。训练矩阵文件包含丰富的气象特征,如目标时间戳(哥本哈根时区)、预报生成时间、提前时间(小时)、提前时间分类、DMI预报特征(dmi_*_pred)、实际观测值(actual_*)、滞后观测特征(obs_*_lag)以及机器学习校正目标(*_correction_target)。数据来源于Open-Meteo的DMI HARMONIE预报和Open-Meteo历史观测数据,地理位置为丹麦奥胡斯(北纬56.1567°,东经10.2108°)。该数据集适用于气象预报、机器学习模型训练等任务。

The DMI Aarhus Meteorological Dataset contains historical weather forecast and actual observation data for the Aarhus region of Denmark. The main files of the dataset include the training matrix (training_matrix.parquet) that integrates forecast and observation features, model registry (model_registry.json), training metadata (model_meta.json), and model packages for each target (*_models.pkl). The training matrix file includes comprehensive meteorological features: target timestamp (Copenhagen Time Zone), forecast generation time, lead time (in hours), lead time category, DMI forecast features (dmi_*_pred), actual observation values (actual_*), lagged observation features (obs_*_lag), and machine learning correction targets (*_correction_target). The data is sourced from DMI HARMONIE forecasts and historical observation data provided by Open-Meteo, with the geographical location being Aarhus, Denmark (56.1567° N, 10.2108° E). This dataset is suitable for tasks such as meteorological forecasting and machine learning model training.
创建时间:
2026-03-02
原始信息汇总

DMI Aarhus Weather Data 数据集概述

数据集基本信息

  • 名称: DMI Aarhus Weather Data
  • 许可协议: CC0 1.0
  • 标签: 天气、奥胡斯、丹麦、预报、观测

数据集描述

该数据集包含丹麦奥胡斯市的历史天气预报和观测数据。

数据文件

  • training_matrix.parquet: 包含合并的预报、观测数据和特征。
  • model_registry.json: 活动模型注册表。
  • model_meta.json: 训练元数据。
  • *_models.pkl: 针对每个预测目标的模型包。

数据模式 (training_matrix.parquet)

列名 描述
target_timestamp 预报的目标时间(哥本哈根时区)
reference_time 预报生成的时间
lead_time_hours 参考时间与目标时间之间的小时数
lead_bucket 提前时间类别(1-6, 7-12, 13-24, 25-48)
dmi_*_pred DMI 预报特征
actual_* 观测到的天气数值
obs_*_lag 滞后观测特征
*_correction_target 机器学习校正目标

数据来源

  • Open-Meteo DMI HARMONIE 预报
  • Open-Meteo 历史观测数据

地理位置

  • 城市: 丹麦奥胡斯
  • 坐标: 56.1567°N, 10.2108°E
搜集汇总
数据集介绍
main_image_url
构建方式
在气象科学领域,高质量的历史数据对于模型验证与预测优化至关重要。DMI Aarhus Weather Data 数据集通过整合丹麦奥胡斯地区的多源气象信息构建而成,其核心数据来源于 Open-Meteo 平台提供的 DMI HARMONIE 数值天气预报及历史观测记录。构建过程中,预报数据与实测观测值依据时间戳对齐并融合,生成了包含预报时间、参考时间、预报时效及多类气象特征变量的结构化矩阵,同时引入了滞后观测特征与机器学习校正目标,为后续分析奠定了坚实基础。
特点
该数据集在气象预测研究领域展现出鲜明的特色,其不仅涵盖了温度、降水等多种关键气象要素的预报与实测值,还通过引入预报时效分桶机制,将复杂的连续时间关系转化为离散的类别,增强了时序特征的表达能力。数据集的结构设计兼顾了预报系统的原始输出与后续机器学习校正的需求,提供了丰富的特征列,如 DMI 预报特征、实际观测值及滞后观测变量等,为深入探索预报偏差的时空规律与校正模型开发提供了多维度的数据支撑。
使用方法
针对气象预测模型的训练与评估,该数据集提供了清晰的使用路径。研究人员可直接加载 `training_matrix.parquet` 文件作为核心数据源,利用其中的预报特征、观测值及校正目标变量构建监督学习任务。数据集内附的模型注册表与元数据文件有助于复现或扩展已有的模型训练流程。典型应用场景包括基于历史预报与观测数据开发机器学习校正模型,以改善特定预报时效内的预测精度,或进行气象预报不确定性的量化分析,推动数值天气预报的后续处理与优化。
背景与挑战
背景概述
气象预测作为地球科学领域的关键分支,其精准性直接影响农业规划、能源调度与灾害预警等社会活动。DMI Aarhus Weather Data数据集由丹麦气象研究所(DMI)与开放数据平台Open-Meteo合作构建,于近年发布,聚焦丹麦奥胡斯地区的历史气象预报与观测数据。该数据集整合了HARMONIE数值天气预报模型的输出结果与地面实测记录,核心研究问题在于通过机器学习方法校正传统数值模型的系统偏差,提升区域尺度气象要素的预测可靠性。其公开共享为气象学、环境科学及数据驱动的气候研究提供了高分辨率基准数据,推动了气象预测与人工智能的交叉融合。
当前挑战
该数据集致力于应对气象预测领域长期存在的挑战,即数值天气预报模型在区域尺度上面临的系统性误差,这些误差源于物理参数化方案的不完善与初始条件的不确定性。构建过程中,研究人员需处理多源异构数据的时空对齐问题,包括协调不同分辨率与采集频率的预报与观测序列。同时,数据融合需克服缺失值插补、异常值检测以及跨数据源的一致性校验等工程技术难题,确保最终生成的特征矩阵能够支撑稳健的机器学习校正模型训练。
常用场景
经典使用场景
在气象学与数据科学交叉领域,DMI Aarhus Weather Data数据集为研究人员提供了一个经典的基准平台,用于开发和验证天气预测模型。该数据集整合了历史天气预报与观测数据,特别适用于评估不同预测时间尺度下的模型性能。通过其结构化的特征列,如预报时间、滞后观测和修正目标,研究者能够系统分析预报误差,并优化预测算法,从而推动高精度天气预报技术的发展。
衍生相关工作
基于该数据集,已衍生出多项经典研究工作,主要集中在机器学习修正天气预报模型方面。例如,研究者开发了基于梯度提升或神经网络的校正算法,以减小DMI HARMONIE预报的系统误差;同时,也有工作探索了多变量时间序列预测方法,利用滞后观测特征提升短期降水或温度预测的精度。这些成果不仅丰富了气象数据分析的方法论,也为后续智能天气预报系统的构建提供了重要参考。
数据集最近研究
最新研究方向
在气象学与数据科学交叉领域,DMI奥胡斯天气数据集正推动着天气预报的精细化与智能化进程。该数据集整合了历史观测与数值预报数据,为机器学习模型提供了丰富的训练基础,当前研究焦点集中于利用深度学习技术对传统数值天气预报结果进行偏差校正,特别是在短时临近预报中提升降水、温度等关键要素的预测精度。随着气候变化引发极端天气事件频发,此类高分辨率区域数据集的应用,不仅优化了城市级气象服务的响应能力,还支撑着可再生能源管理、交通物流等行业的决策系统,彰显了数据驱动方法在提升公共安全与经济效益方面的深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作