GRINS AQCLIM dataset
收藏arXiv2026-02-19 更新2026-02-20 收录
下载链接:
https://zenodo.org/records/7956006
下载链接
链接失效反馈官方服务:
资源简介:
GRINS AQCLIM数据集是由GRINS项目创建的意大利空气质量数据集,覆盖2013至2023年间的744个监测站点,包含每日空气污染物(如NO2、PM10、O3等)和气候变量的统计量(最小值、均值、最大值等)。数据来源于欧洲环境局和哥白尼计划,经过多步骤质量控制,包括自动修复原始文件、手动检查站点信息、异常检测与移除以及时间分辨率统一。该数据集旨在解决意大利空气质量数据分散、难以获取的问题,为公共健康研究、政策规划和环境建模提供可靠数据支持。
The GRINS AQCLIM Dataset is an Italian air quality dataset developed by the GRINS project. It covers 744 monitoring stations from 2013 to 2023, and contains statistics including minimum, mean, maximum values and others of daily air pollutants such as NO₂, PM₁₀, O₃ and other contaminants, as well as climatic variables. The data is sourced from the European Environment Agency and the Copernicus Programme, and has undergone multi-stage quality control procedures, including automatic restoration of original files, manual inspection of station information, anomaly detection and removal, as well as unification of temporal resolution. This dataset aims to address the issues of scattered and inaccessible Italian air quality data, providing reliable data support for public health research, policy planning and environmental modeling.
提供机构:
贝尔加莫大学·工程与应用科学系; 贝尔加莫大学·经济系
创建时间:
2026-02-11
搜集汇总
数据集介绍
构建方式
在环境科学领域,高质量、标准化的空气质量数据集对于公共健康研究和政策制定至关重要。GRINS AQCLIM 数据集构建于 GRINS 项目框架下,覆盖意大利2013年至2023年的每日空气质量与气候数据。其构建过程始于从欧洲环境署(EEA)和哥白尼计划(Copernicus Programme)获取原始监测数据,涉及超过20,000个CSV文件。通过自动化流程修复文件重复问题,并辅以人工检查站点信息,确保地理坐标与分类准确性。数据经过异常值检测与剔除,采用固定阈值过滤极端浓度值,随后通过卡尔曼平滑方法对小时缺失值进行插补,最终将小时数据统一为每日统计量(包括最小值、四分位数、均值、中位数和最大值),并与ERA5再分析资料中的气候变量进行时空匹配,形成一套经过严格质量控制、可直接用于分析的标准化数据集。
特点
该数据集的核心特点在于其全面性与高质量处理。它整合了意大利744个地面监测站点超过11年的每日观测,涵盖八种主要空气污染物(如NO2、PM10、PM2.5、O3等)以及九种关键气候变量(如边界层高度、温度、降水、风速等),提供了丰富的协变量信息以支持建模。数据集经过多重清洗步骤,包括自动修复原始文件冲突、手动校正站点元数据、基于统计分布的异常值剔除,以及利用状态空间模型进行缺失值插补,显著提升了数据的可靠性与一致性。此外,数据集以开放获取原则托管于Zenodo平台,提供CSV和R格式,并附有站点注册信息与插补不确定性量化数据,增强了研究的可重复性与透明度。
使用方法
研究人员可通过Zenodo或Amelia平台直接下载GRINS AQCLIM数据集,获取包含空气质量与气候两部分的整合文件。数据集按站点标识码与日期组织,便于进行时间序列分析与空间建模。在应用时,用户可结合附带的站点注册信息进行地理空间分析,或利用插补不确定性数据评估统计推断的可靠性。该数据集适用于多种研究场景,例如:评估空气污染对公共健康的影响、开发时空统计模型以预测污染物扩散、分析气候变量与空气质量的相互作用,以及支持区域环境政策的情景模拟。通过提供经过验证的、可直接使用的标准化数据,该数据集有效降低了数据预处理负担,促进了跨学科研究的开展。
背景与挑战
背景概述
空气污染与气候变化是意大利社会面临的核心议题,深刻影响着公共卫生与政策规划等多个研究领域。在现有数据资源呈现碎片化分布的背景下,由意大利贝尔加莫大学研究人员主导、在欧盟NextGenerationEU资助的GRINS项目框架下,于2026年创建了GRINS AQCLIM数据集。该数据集系统整合了2013年至2023年间意大利境内超过700个地面监测站的每日空气质量与气候变量统计信息,旨在为相关研究提供一个标准化、高质量且易于获取的数据基础。其核心研究问题聚焦于如何构建一个经过严格质量控制、时空分辨率统一的长期序列数据集,以支持空气污染的健康效应评估、排放策略分析与时空统计模型比较等跨学科研究,对推动意大利环境流行病学与可持续城市管理研究具有显著影响力。
当前挑战
GRINS AQCLIM数据集致力于解决意大利空气质量长期监测数据整合与标准化访问的核心挑战。在领域问题层面,其核心挑战在于克服现有数据源的分散性与异质性,为高污染区域(如波河流域)的健康影响研究、城市绿色规划情景分析以及不同时空统计模型的公平比较提供一致、可靠的数据基准。在构建过程中,研究团队面临多重技术挑战:原始数据来自欧洲环境局,存在文件重复、同一监测站在不同文件中标识冲突、时间分辨率不一致以及异常高值记录等问题;此外,监测站元数据中存在坐标重复、分类信息错误等情况,需结合卫星影像进行人工核查与修正。为确保数据质量,团队实施了自动化的重复检测与修复流程,并针对各污染物浓度分布的非高斯特性,通过百分位数分析与可视化诊断设定了科学合理的异常值过滤阈值,最终完成了从原始小时数据到高质量日统计量的复杂转换与整合。
常用场景
经典使用场景
在环境科学与公共卫生交叉领域,GRINS AQCLIM数据集为研究人员提供了意大利境内2013至2023年间每日空气质量与气候变量的标准化观测记录。该数据集整合了超过700个地面监测站的多种污染物浓度(如PM2.5、NO2、O3)及相关气象参数,其经典应用场景集中于构建高精度时空统计模型。学者们借助其丰富的日度统计量(包括最小值、四分位数、均值、中位数与最大值),能够深入分析污染物浓度的时空分布规律,尤其适用于探究波河谷等重污染区域的长期污染动态与扩散机制。
衍生相关工作
基于该数据集衍生的经典工作包括对PM2.5浓度时空建模的比较研究,其中应用了异方差时空模型以解析污染物在伦巴第等地区的传播机制。此外,数据集启动了关于畜牧业活动与颗粒物污染关联的情景分析,拓展了农业环境影响的量化评估方法。在方法论层面,研究团队利用卡尔曼平滑器进行缺失值插补,并提供了不确定性量化框架,这些技术已被应用于其他欧洲空气质量数据集的构建,促进了环境数据科学中处理非平稳时间序列的标准流程发展。
数据集最近研究
最新研究方向
在环境科学与公共健康交叉领域,GRINS AQCLIM数据集为意大利空气质量研究提供了标准化、高质量的长时序数据基础。当前前沿研究聚焦于利用该数据集开展时空统计建模,特别是结合气候变量分析污染物扩散机制,以评估极端污染事件对人群健康的影响。热点方向包括将机器学习方法应用于空气质量预测,以及探究PM2.5、臭氧等污染物与呼吸系统疾病、神经退行性疾病之间的关联性。该数据集通过整合多源监测数据与ERA5再分析资料,支持城市可持续规划与减排策略的情景模拟,对推动欧洲绿色转型与健康风险评估具有重要科学价值。
相关研究论文
- 1The Dataset of Daily Air Quality for the Years 2013-2023 in Italy贝尔加莫大学·工程与应用科学系; 贝尔加莫大学·经济系 · 2026年
以上内容由遇见数据集搜集并总结生成



