meteogate-archive
收藏Hugging Face2026-03-05 更新2026-03-06 收录
下载链接:
https://huggingface.co/datasets/alexdum/meteogate-archive
下载链接
链接失效反馈官方服务:
资源简介:
Meteogate欧洲气象观测档案是一个不断增长的实时气象观测数据集,来源于EUMETNET Meteogate E-SOH服务,覆盖了欧洲数千个气象站。数据集采用长格式存储,每个Parquet文件包含观测时间、站点ID、站点名称、经纬度、观测变量、测量高度、统计方法、聚合周期、观测值、单位以及数据提供者等信息。观测变量包括温度和湿度、风、降水、大气压力、辐射和日照、能见度和云、雪、海和波浪等多个类别,遵循CF标准命名约定。数据由EUMETNET成员国的国家气象服务机构提供,包括挪威、芬兰和荷兰等国的气象机构。数据集的时间覆盖从2026年3月开始,空间覆盖欧洲EUMETNET成员国的气象站,分辨率为1分钟、2分钟、10分钟、每小时和3小时聚合。数据以Apache Parquet格式存储,按日期分区。数据集采用CC-BY-4.0许可,使用时需引用EUMETNET和Meteogate E-SOH API。
创建时间:
2026-03-03
原始信息汇总
Meteogate European Weather Observations Archive 数据集概述
数据集基本信息
- 名称: Meteogate European Weather Observations Archive
- 许可证: CC-BY-4.0
- 任务类别: 时间序列预测,表格回归
- 标签: 气象学,天气,观测,欧洲,EUMETNET,Meteogate,E-SOH,CF标准,WIGOS
- 数据规模: 1M < n < 10M
- 数据格式: Apache Parquet
数据内容与结构
数据集是一个持续增长的欧洲实时气象观测档案,数据来源于EUMETNET Meteogate E-SOH服务,覆盖欧洲数千个气象站。
数据结构
每个Parquet文件以长格式存储观测数据(每行代表一个站点 × 变量 × 时间戳),包含以下列:
| 列名 | 类型 | 描述 |
|---|---|---|
timestamp |
datetime | UTC时间的观测时间 |
station_id |
string | WIGOS站点标识符 |
station_name |
string | 可读的站点名称 |
latitude |
float | 站点纬度(十进制度,WGS 84) |
longitude |
float | 站点经度(十进制度,WGS 84) |
standard_name |
string | 观测变量的CF标准名称 |
level |
string | 测量高度/深度(米) |
method |
string | 统计方法:point(瞬时),mean,maximum,sum |
duration |
string | 聚合周期(ISO 8601持续时间格式) |
value |
float | 观测数值 |
unit |
string | 测量单位(SI或常规单位) |
naming_authority |
string | 数据提供者标识符 |
持续时间代码
| 代码 | 含义 |
|---|---|
PT0S |
瞬时测量 |
PT1M |
1分钟聚合 |
PT2M |
2分钟聚合 |
PT10M |
10分钟聚合 |
PT1H |
1小时聚合 |
PT3H |
3小时聚合 |
观测变量
所有变量名称均遵循CF标准名称约定。
温度与湿度
air_temperature:气温(单位:°C)dew_point_temperature:露点温度(单位:°C)relative_humidity:相对湿度(单位:%)soil_temperature:土壤温度(单位:°C)sea_surface_temperature:海面温度(单位:°C)
风
wind_speed:风速(单位:m/s)wind_from_direction:风向(单位:度)wind_speed_of_gust:阵风风速(单位:m/s)
降水
precipitation_amount:降水量(单位:kg/m²)rainfall_rate:降雨率(单位:mm/h)
大气压力
air_pressure:气压(单位:hPa)air_pressure_at_mean_sea_level:平均海平面气压(单位:hPa)surface_air_pressure:地表气压(单位:hPa)tendency_of_surface_air_pressure:地表气压变化趋势(单位:hPa)
辐射与日照
surface_downwelling_shortwave_flux_in_air:地表下行短波辐射通量(单位:W/m²)surface_diffuse_downwelling_shortwave_flux_in_air:地表漫射下行短波辐射通量(单位:W/m²)duration_of_sunshine:日照时长(单位:s)
能见度与云
visibility_in_air:能见度(单位:m)cloud_area_fraction:云量(单位:okta)
雪
surface_snow_thickness:地表雪深(单位:cm)
海洋与波浪
sea_surface_wave_significant_height:有效波高(单位:m)sea_surface_wave_maximum_height:最大波高(单位:m)sea_surface_wave_mean_period:平均波周期(单位:s)sea_surface_wave_significant_period:有效波周期(单位:s)sea_surface_wave_maximum_period:最大波周期(单位:s)sea_surface_wave_period_at_variance_spectral_density_maximum:谱峰波周期(单位:s)sea_surface_wave_period_of_highest_wave:最高波周期(单位:s)sea_surface_wave_from_direction:波向(单位:度)sea_surface_wave_from_direction_at_variance_spectral_density_maximum:谱峰波向(单位:度)sea_surface_wave_mean_period_from_variance_spectral_density_first_frequency_moment:基于谱一阶频率矩的平均波周期(单位:s)sea_water_speed:海水流速(单位:m/s)
数据提供者
数据由EUMETNET成员国的国家气象服务机构发布。目前已观测到的提供者包括:
naming_authority |
机构 | 国家 |
|---|---|---|
no.met |
挪威气象研究所 | 挪威 |
fi.fmi |
芬兰气象研究所 | 芬兰 |
nl.knmi |
荷兰皇家气象研究所 | 荷兰 |
数据覆盖范围
- 时间范围: 从2026年3月开始(持续增长,每10分钟存档一次)
- 空间范围: 来自EUMETNET成员国的欧洲气象站
- 时间分辨率: 1分钟、2分钟、10分钟、小时和3小时聚合
- 存储格式与分区: Apache Parquet,按
data/YYYY/MM/YYYY-MM-DD.parquet分区
数据来源与引用
- 数据来源: EUMETNET E-SOH服务(https://observations.meteogate.eu/)
- 引用要求:
- EUMETNET — https://www.eumetnet.eu/
- Meteogate E-SOH API — https://observations.meteogate.eu/
搜集汇总
数据集介绍
构建方式
在气象观测数据整合领域,Meteogate欧洲天气观测档案库的构建体现了现代数据工程的严谨性。该数据集源自EUMETNET Meteogate E-SOH服务的实时气象观测流,通过自动化管道持续采集欧洲数千个气象站的多变量数据。数据以Apache Parquet格式存储,采用纵向长格式结构,每条记录对应特定时间戳、站点和观测变量,并包含测量高度、统计方法和聚合周期等元数据。数据按年月日分区归档,确保了高效查询与可扩展性,同时严格遵循CF标准命名法和WIGOS标识规范,保障了数据的互操作性与标准化水平。
特点
该数据集的核心特点在于其高度的结构化和多维覆盖能力。它囊括了温度、湿度、风、降水、气压、辐射、能见度、云层、雪况及海洋波浪等二十余种气象变量,每种变量均标注了标准名称、单位和测量方法。时空维度上,数据覆盖欧洲多国气象站,时间分辨率从瞬时测量到三小时聚合不等,提供了精细的时间序列。数据来源权威,由挪威、芬兰、荷兰等国家级气象机构提供,并采用CC-BY-4.0许可,促进了学术与商业应用的开放性。这种综合性与规范性使其成为欧洲区域气象研究的宝贵资源。
使用方法
针对时间序列预测与表格回归任务,该数据集的使用需结合其分区存储和变量特性。用户可通过读取特定日期的Parquet文件,按站点、变量或时间范围进行筛选,构建监督学习特征。例如,可利用历史温度、风速和气压数据预测未来天气趋势,或基于土壤温度与降水进行农业模型回归。数据处理时应注意不同聚合周期和测量高度的差异,并可利用经纬度信息进行空间分析。数据集兼容主流数据分析框架,如Pandas和PySpark,适合用于气候建模、可再生能源评估及极端天气事件研究等应用场景。
背景与挑战
背景概述
气象观测数据的系统化整合与开放共享是提升天气预测精度与气候研究深度的关键基础。Meteogate欧洲天气观测档案数据集由EUMETNET(欧洲气象服务网络联盟)主导构建,其核心研究问题在于聚合来自欧洲多国气象机构的实时观测数据,形成标准化、可互操作的高质量资源。该数据集自2026年3月起持续更新,覆盖温度、湿度、风速、降水、气压、辐射及海浪等多维变量,遵循CF标准命名与WIGOS标识规范,旨在支持高分辨率数值天气预报、极端天气事件分析与气候变化建模等前沿领域,为气象科学与工程应用提供了统一的数据基石。
当前挑战
该数据集致力于解决欧洲区域高时空分辨率气象数据融合与预测的复杂问题,其挑战体现在多源异构数据的实时集成、观测缺失与异常值的质量控制,以及跨国家、跨机构数据标准的统一协调。在构建过程中,面临数据流持续增长带来的存储与处理压力,不同观测频率(如分钟级至小时级)与测量方法(如点测与统计聚合)的规范化表述,以及确保数据分区(按时间与变量)的高效查询与可扩展性。此外,维持数据提供者的持续参与并扩展地理覆盖范围,亦是实现数据集长期价值的关键。
常用场景
经典使用场景
在气象学与气候科学领域,高时空分辨率的观测数据是驱动模型发展与验证的基石。Meteogate欧洲天气观测档案以其覆盖全欧数千个气象站、分钟至小时级的多变量连续记录,为时间序列预测与回归分析提供了经典范例。研究者常利用其结构化Parquet格式,整合温度、湿度、风速、降水等关键气象要素,构建深度学习或统计模型,以精准预报短期天气变化或分析极端气候事件的形成机制。
解决学术问题
该数据集有效应对了气象研究中数据碎片化与标准不一的挑战。通过遵循CF标准命名与WIGOS标识规范,它实现了跨国家、多源观测数据的无缝整合,为区域气候模式评估、大气边界层过程解析以及水文气象耦合研究提供了可靠基准。其高精度时序记录尤其助力于改进数值天气预报的初始化场,深化了对欧洲天气系统时空演变规律的理解。
衍生相关工作
基于该数据集的高质量观测,已催生一系列创新研究。例如,结合图神经网络与时空注意力机制,学者开发了区域天气超分辨率预报模型;另有工作利用其多变量序列,训练端到端的极端降水早期预警系统。这些衍生成果不仅推动了气象AI的发展,也为海洋波浪预测、城市热岛效应监测等交叉学科提供了数据驱动的解决方案。
以上内容由遇见数据集搜集并总结生成



