five

WeatherBench和Copernicus Atmosphere Monitoring Service (CAMS)

收藏
github2025-02-27 更新2025-02-28 收录
下载链接:
https://github.com/vishalned/AirCast
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了用于天气变量和空气质量变量的数据,被用于创建一个结合了天气和空气质量变量的联合数据集。

This dataset comprises data related to weather variables and air quality variables, and is utilized to create a joint dataset integrating both weather and air quality variables.
创建时间:
2025-02-24
原始信息汇总

AirCast数据集概述

数据集简介

  • 名称: AirCast
  • 用途: 用于空气质量预测的多变量数据集
  • 核心创新: 结合天气和空气质量变量,采用多任务头架构进行预测

数据来源

  • 天气变量: 来自WeatherBench数据集
  • 空气质量变量: 来自Copernicus Atmosphere Monitoring Service (CAMS)

数据处理

  • 对两个数据集进行了时间和空间维度的对齐
  • 创建了天气和空气质量变量的组合数据集

当前状态

  • 数据尚未公开(标注为"Stay tuned")
  • 模型权重尚未公开(标注为"Stay tuned")

技术特点

  • 采用改进的ClimaX模型进行区域空气质量预测
  • 提出频率加权平均绝对误差(fMAE)损失函数
  • 基于领域知识选择关键影响变量

相关论文

  • 标题: AirCast: Improving Air Pollution Forecasting Through Multi-Variable Data Alignment
  • arXiv编号: 2502.17919
  • 年份: 2025
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建是基于WeatherBench与Copernicus Atmosphere Monitoring Service (CAMS)两大来源的气象与空气质量数据。研究者们首先将两个数据集在时间与空间维度上进行对齐,从而创建了一个包含气象与空气质量变量的综合数据集,为多变量空气质量预测模型AirCast的训练提供了基础。
特点
该数据集的特点在于其融合了气象与空气质量的多变量信息,有助于模型更全面地理解天气模式对空气质量的影响。同时,数据集通过特定的变量选择策略,突出了对污染水平影响显著的关键变量,并采用频率加权平均绝对误差(fMAE)损失函数,优化了对极端污染事件预测的准确性。
使用方法
使用该数据集进行模型训练时,用户需要先安装必要的依赖库,然后通过指定配置文件启动训练脚本。数据集与模型权重将通过公开渠道供研究者使用,具体安装与训练命令已在README中详细说明。
背景与挑战
背景概述
AirCast模型的研究背景源于空气污染作为全球主要健康风险之一,其问题日益严重,特别是在工业化和城市化快速发展的背景下。该模型由Vishal Nedungadi等研究人员开发,旨在通过结合天气和空气质量变量,提高空气污染预报的准确性。本研究使用了WeatherBench和Copernicus Atmosphere Monitoring Service (CAMS)的数据集,创建了包含天气和空气质量变量的联合数据集,以期为相关领域提供一种新的多变量空气污染预报方法。该研究对于提高我们对天气模式如何影响空气质量的认知,具有显著影响,并有望对空气污染预报领域产生重要贡献。
当前挑战
在构建AirCast模型的过程中,研究人员面临了多重挑战。首先,极端污染事件在历史数据中发生频率较低,导致污染水平分布呈现重尾特征,预测这类事件极具挑战性。其次,如何有效地对齐WeatherBench和CAMS两个数据集在时间和空间上的维度,以确保数据的准确性和一致性,也是构建过程中的一个重要挑战。此外,选择对污染水平有重要影响的关键变量,以及适应回归任务的频率加权平均绝对误差(fMAE)损失函数的提出,均是对传统方法的改进和挑战。
常用场景
经典使用场景
在环境科学和气象学领域,WeatherBench与Copernicus Atmosphere Monitoring Service (CAMS)数据集的融合应用,为构建AirCast模型提供了基础。该模型通过多变量数据对齐,旨在提高空气质量预报的准确性。经典的使用场景在于,研究者采用该数据集对天气和空气质量变量进行联合学习,从而预测大气状况和污染物浓度,以便更好地理解天气模式如何影响空气质量。
解决学术问题
该数据集的整合解决了空气质量预测中的关键学术问题,特别是在预测极端污染事件上。由于这些事件在历史数据中发生频率较低,传统的预测模型难以准确预测。AirCast模型通过引入频率加权的平均绝对误差(fMAE)损失函数,优化了极端污染事件的预测能力,同时,通过领域知识指导的关键变量选择,提高了模型的预报精度。
衍生相关工作
基于WeatherBench和CAMS数据集的AirCast模型,已经催生了多项后续研究工作。这些工作包括但不限于对模型结构的优化、对更多污染物类型的预测,以及在不同地区和气候条件下的模型适应性研究,为空气质量预报领域带来了新的研究视角和技术进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作