alexdum/meteogate-archive
收藏Hugging Face2026-05-02 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/alexdum/meteogate-archive
下载链接
链接失效反馈官方服务:
资源简介:
Meteogate欧洲天气观测档案是一个不断增长的实时气象观测数据集,来自EUMETNET Meteogate E-SOH服务,覆盖欧洲数千个气象站。数据集以长格式存储,每行代表一个气象站、变量和时间戳的组合。包含的观测数据有温度、湿度、风、降水、大气压力、辐射、能见度、云、雪和海况等。数据由EUMETNET成员国的国家气象服务机构提供,时间覆盖从2026年3月开始,空间覆盖欧洲气象站,时间分辨率为1分钟、2分钟、10分钟、小时和3小时。数据以Apache Parquet格式存储,按年/月/日分区。数据集采用CC-BY-4.0许可,使用时需引用EUMETNET和Meteogate E-SOH API。
The Meteogate European Weather Observations Archive is a continuously growing archive of real-time meteorological observations from the EUMETNET Meteogate E-SOH service, covering thousands of weather stations across Europe. The dataset is stored in long format, with each row representing a combination of station, variable, and timestamp. It includes observations such as temperature, humidity, wind, precipitation, atmospheric pressure, radiation, visibility, clouds, snow, and sea conditions. Data is provided by national meteorological services of EUMETNET member countries, with temporal coverage starting from March 2026 and spatial coverage across European weather stations. The data is available in 1-minute, 2-minute, 10-minute, hourly, and 3-hourly aggregations, stored in Apache Parquet format and partitioned by year/month/day. The dataset is licensed under CC-BY-4.0 and requires citation of EUMETNET and Meteogate E-SOH API when used.
提供机构:
alexdum
原始信息汇总
数据集详情:Meteogate European Weather Observations Archive
- 数据集地址:https://hf-mirror.com/datasets/alexdum/meteogate-archive
- 任务类型:时间序列预测、表格回归
- 数据模态:表格、文本
- 数据格式:Parquet
- 数据大小:100M - 1B 行
- 标签:气象、天气、观测、欧洲、EUMETNET、Meteogate
- 支持的库:Datasets、Dask、Polars
- 许可证:cc-by-4.0
数据集描述
该数据集是一个持续增长的欧洲实时气象观测数据档案,数据来源于 EUMETNET Meteogate E-SOH 服务,覆盖欧洲数千个气象站。
数据结构
每个 Parquet 文件以 长格式 存储观测数据(每一行对应一个站点 × 变量 × 时间戳的组合),包含以下列:
| 列名 | 类型 | 描述 |
|---|---|---|
timestamp |
datetime (UTC) | 观测时间 |
station_id |
string | WIGOS 站点标识符(例如 0-20000-0-06201) |
station_name |
string | 可读的站点名称 |
latitude |
float | 站点纬度(十进制,WGS 84) |
longitude |
float | 站点经度(十进制,WGS 84) |
standard_name |
string | CF 标准变量名称 |
level |
string | 测量高度/深度(米,例如 2.0, 10.0, 0.05) |
method |
string | 统计方法:point(瞬时)、mean(平均)、maximum(最大)、sum(总和) |
duration |
string | 聚合周期(ISO 8601 格式,例如 PT0S, PT1M, PT10M, PT1H, PT3H) |
value |
float | 观测数值 |
unit |
string | 测量单位(SI 或常规单位) |
naming_authority |
string | 数据提供者标识符(例如 no.met, fi.fmi, nl.knmi) |
持续时间代码
| 代码 | 含义 |
|---|---|
PT0S |
瞬时测量 |
PT1M |
1 分钟聚合 |
PT2M |
2 分钟聚合 |
PT10M |
10 分钟聚合 |
PT1H |
1 小时聚合 |
PT3H |
3 小时聚合 |
观测变量
所有变量名称遵循 CF 标准名称 约定,分类如下:
🌡️ 温度与湿度
| standard_name | 单位 | 描述 |
|---|---|---|
air_temperature |
°C | 空气温度(通常 2 米高度) |
dew_point_temperature |
°C | 露点温度(2 米高度) |
relative_humidity |
% | 相对湿度 |
soil_temperature |
°C | 土壤温度(例如 0.05 米深度) |
sea_surface_temperature |
°C | 海表温度 |
🌬️ 风
| standard_name | 单位 | 描述 |
|---|---|---|
wind_speed |
m/s | 持续风速(通常 10 米高度) |
wind_from_direction |
deg | 风向(0° = 北,90° = 东) |
wind_speed_of_gust |
m/s | 聚合周期内最大阵风风速 |
🌧️ 降水
| standard_name | 单位 | 描述 |
|---|---|---|
precipitation_amount |
kg/m² | 累计降水量(雨 + 雪,液态水当量) |
rainfall_rate |
mm/h | 降雨强度 |
🔵 大气压
| standard_name | 单位 | 描述 |
|---|---|---|
air_pressure |
hPa | 站点气压 |
air_pressure_at_mean_sea_level |
hPa | 海平面气压(QFF/QNH) |
surface_air_pressure |
hPa | 地表传感器高度气压 |
tendency_of_surface_air_pressure |
hPa | 3 小时内表面气压变化 |
☀️ 辐射与日照
| standard_name | 单位 | 描述 |
|---|---|---|
surface_downwelling_shortwave_flux_in_air |
W/m² | 地表向下的总短波(太阳)辐射 |
surface_diffuse_downwelling_shortwave_flux_in_air |
W/m² | 向下短波辐射的散射分量 |
duration_of_sunshine |
s | 聚合周期内的日照时长 |
👁️ 能见度与云
| standard_name | 单位 | 描述 |
|---|---|---|
visibility_in_air |
m | 水平能见度 |
cloud_area_fraction |
okta | 总云量(0 = 晴朗,8 = 阴天) |
❄️ 雪
| standard_name | 单位 | 描述 |
|---|---|---|
surface_snow_thickness |
cm | 地表积雪深度 |
🌊 海洋与波浪
| standard_name | 单位 | 描述 |
|---|---|---|
sea_surface_wave_significant_height |
m | 有效波高(H_s,前三分之一平均波高) |
sea_surface_wave_maximum_height |
m | 最大单个波高 |
sea_surface_wave_mean_period |
s | 平均波周期 |
sea_surface_wave_significant_period |
s | 有效波周期 |
sea_surface_wave_maximum_period |
s | 最大波周期 |
数据子集
- 子集:
default(210M 行) - 划分:仅
train(210M 行)
数据预览(示例)
| timestamp | station_id | station_name | ... | value | unit |
|---|---|---|---|---|---|
| 2026-03-03T20:36:00 | 0-20000-0-01001 | JAN MAYEN | ... | 1.3 | °C |
| 2026-03-03T20:36:00 | 0-20000-0-01001 | JAN MAYEN | ... | 0.37 | mm/h |
| 2026-03-03T20:40:00 | 0-20000-0-01007 | NY-ÅLESUND | ... | -2.7 | °C |
| ... | ... | ... | ... | ... | ... |
数据来源与许可证
- 数据提供者:EUMETNET Meteogate E-SOH 服务
- 许可证:Creative Commons Attribution 4.0 International (CC-BY-4.0)
搜集汇总
数据集介绍

构建方式
在气象观测领域,数据集的构建方式深刻影响着其科学价值与应用潜力。Meteogate欧洲气象观测档案库依托EUMETNET Meteogate E-SOH服务,实现了对欧洲范围内数千个气象站实时观测数据的持续采集与归档。该数据集以Apache Parquet格式存储,采用长格式数据结构,每一行对应特定时间戳、站点及观测变量的组合。数据按时间分区组织,以每日为单位存储,确保了高效的数据管理与查询。观测值涵盖了从瞬时测量到多种时间聚合周期的记录,严格遵循CF标准命名规范,并标注了测量高度、统计方法及数据提供机构等元信息,构建了一个结构化、可追溯的高质量气象数据资源。
特点
该数据集的核心特点在于其广泛的空间覆盖与精细的时间分辨率。它汇聚了来自挪威、芬兰、荷兰等多个欧洲国家气象机构的观测数据,并持续扩展以纳入更多EUMETNET成员国的贡献。数据集不仅包含了气温、湿度、风速、降水等常规气象要素,还纳入了土壤温度、海面温度、波浪参数以及辐射通量等专业变量,提供了多维度的环境状态信息。所有变量均采用国际通用的CF标准名称与SI单位制,确保了数据的一致性与互操作性。其时间分辨率从分钟级到小时级不等,支持对不同时间尺度的气象过程进行分析,为气象研究与应用提供了丰富而可靠的数据基础。
使用方法
在气象预测与环境建模研究中,该数据集为时间序列分析与回归任务提供了直接支持。用户可通过读取分区Parquet文件高效访问特定日期或时间段的数据,并利用`station_id`、`standard_name`等关键字段进行筛选与聚合。数据集的长格式设计便于与各类数据分析库(如Pandas、Dask)集成,以进行时空插值、趋势分析或作为机器学习模型的输入特征。研究者可结合站点经纬度信息进行空间分析,或利用不同聚合周期(如PT1M、PT1H)的数据研究气象变量的短期波动与长期演变。数据遵循CC-BY-4.0许可,允许在注明来源的前提下自由使用、共享与改编,适用于学术研究、业务预报及气候服务等多种场景。
背景与挑战
背景概述
Meteogate欧洲气象观测档案数据集由EUMETNET(欧洲气象服务网络联盟)于2026年3月启动创建,旨在整合其成员国家气象服务机构提供的实时气象观测数据。该数据集的核心研究问题在于构建一个标准化、高时空分辨率的欧洲区域气象观测数据库,以支持气象学、气候科学及环境研究领域的模型验证、极端天气事件分析和预测算法开发。通过采用CF标准命名规范与WIGOS站点标识体系,数据集显著提升了多源气象数据的互操作性与可比性,为跨区域气象研究提供了关键基础设施。
当前挑战
该数据集致力于解决气象观测数据整合与高精度时空预测的领域挑战,具体包括:处理来自不同国家、不同仪器标准的异构数据源的一致性问题;应对高频时间序列数据中常见的缺失值、异常值及测量误差的质控难题;以及满足气候变化研究与数值天气预报对长时序、高密度观测数据的需求。在构建过程中,挑战主要集中于实现实时数据流的稳定采集与归档,确保跨机构数据格式与元数据的统一映射,并维护大规模时间序列数据(规模达百万至千万级)在存储与访问效率上的平衡。
常用场景
经典使用场景
在气象科学领域,高时空分辨率的观测数据是驱动研究进展的核心要素。Meteogate欧洲天气观测档案以其覆盖欧洲数千个气象站、包含温度、湿度、风、降水等多变量的实时与历史记录,为时间序列预测模型提供了经典的训练与验证场景。研究者广泛利用其标准化的长格式数据,开发并评估先进的机器学习与深度学习算法,以提升短期至中期的天气要素预报精度。
衍生相关工作
基于该数据集丰富、标准化的观测信息,已催生了一系列有影响力的衍生研究。这些工作主要集中在利用深度学习架构(如Transformer、图神经网络)进行多站点协同预测、开发新型的数据同化方法以改进数值天气预报初始场,以及构建面向特定行业(如海事、航空)的定制化风险预警模型。这些研究持续推动着气象人工智能从理论到应用的转化。
数据集最近研究
最新研究方向
在气象科学领域,高分辨率观测数据的涌现正推动着精细化天气预测与气候建模的革新。Meteogate欧洲天气观测档案以其覆盖广泛、时间频率密集的多变量结构,成为当前研究的热点资源。学者们正致力于利用其分钟级至小时级的序列数据,开发基于深度学习的时空预测模型,以提升极端天气事件的短临预报能力。同时,该数据集与欧盟绿色新政及气候适应战略紧密关联,支持跨学科研究如可再生能源功率预测、城市热岛效应分析及海洋气象灾害评估。这些探索不仅深化了对区域气候系统的理解,也为智慧城市与可持续发展提供了关键数据支撑。
以上内容由遇见数据集搜集并总结生成



