five

Bihar PM2.5 Dataset, KnowAir Dataset

收藏
arXiv2024-12-18 更新2024-12-25 收录
下载链接:
https://github.com/malayp717/pm2.5
下载链接
链接失效反馈
官方服务:
资源简介:
本研究使用了两个PM2.5浓度数据集,分别来自印度比哈尔邦和中国严重污染地区。比哈尔邦的数据集由511个低成本PM2.5传感器网络收集,覆盖了整个比哈尔邦,时间为2023年5月1日至2024年4月30日,包含每小时的PM2.5浓度及气象特征。中国数据集则涵盖了2015年至2018年的严重污染区域,提供了详细的气象和PM2.5数据。数据集的创建过程结合了现场监测和ERA5气候再分析数据,确保了数据的完整性和准确性。这些数据集主要用于空气质量监测和PM2.5浓度的时空预测,旨在帮助制定有效的污染控制策略和早期预警系统。

This study utilized two PM2.5 concentration datasets, sourced respectively from Bihar State, India, and heavily polluted regions in China. The dataset from Bihar was collected via a network of 511 low-cost PM2.5 sensors, covering the entire state, spanning from May 1, 2023 to April 30, 2024, and includes hourly PM2.5 concentrations and meteorological features. The Chinese dataset covers heavily polluted regions from 2015 to 2018, providing detailed meteorological and PM2.5 data. The datasets were constructed by combining in-situ monitoring data and ERA5 climate reanalysis data, ensuring their integrity and accuracy. These datasets are primarily used for air quality monitoring and spatiotemporal prediction of PM2.5 concentrations, aiming to support the development of effective pollution control strategies and early warning systems.
提供机构:
印度理工学院坎普尔分校
创建时间:
2024-12-18
搜集汇总
数据集介绍
main_image_url
构建方式
Bihar PM2.5 Dataset和KnowAir Dataset的构建基于对PM2.5浓度的时空预测需求。Bihar数据集通过分布在印度比哈尔邦511个地点的低成本PM2.5传感器网络,收集了为期一年的PM2.5浓度数据,并结合了气象特征如相对湿度和昼夜温度。KnowAir数据集则覆盖了中国严重污染区域,历时四年,提供了类似的气象和空气质量数据。数据预处理中,采用了多重插补法(MICE)处理缺失值,并结合了ERA5气候再分析数据,以增强节点属性。
特点
Bihar PM2.5 Dataset和KnowAir Dataset具有显著的时空特性。Bihar数据集覆盖了比哈尔邦全境,提供了高密度的PM2.5监测数据,能够捕捉到区域内的细微变化。KnowAir数据集则因其长时间跨度和广泛的地理覆盖,能够反映PM2.5浓度的季节性变化和长期趋势。两个数据集均结合了气象数据,如风速、风向和边界层高度,这些特征对PM2.5的扩散和传输具有重要影响,使得数据集在时空预测任务中具有高度的复杂性和实用性。
使用方法
Bihar PM2.5 Dataset和KnowAir Dataset主要用于时空预测模型的训练和评估。研究者可以利用这些数据集构建基于图神经网络(GNN)和门控循环单元(GRU)的编码器-解码器架构,以捕捉PM2.5浓度的时空依赖性。具体使用时,数据集的历史数据被输入编码器,通过GNN捕捉空间扩散,GRU捕捉时间序列趋势,解码器则生成未来的PM2.5浓度预测。此外,数据集还可用于评估模型在不同地理区域和季节变化下的泛化能力,为空气质量监测和政策制定提供科学依据。
背景与挑战
背景概述
Bihar PM2.5 Dataset和KnowAir Dataset是两个专注于空气质量监测的数据集,特别是针对细颗粒物(PM2.5)浓度的时空预测。Bihar PM2.5 Dataset由印度坎普尔理工学院的研究团队于2023年创建,涵盖了印度比哈尔邦511个地点的PM2.5浓度数据,时间跨度为一年。KnowAir Dataset则是一个公开数据集,覆盖了中国严重污染地区的PM2.5数据,时间跨度为四年。这两个数据集的核心研究问题是通过捕捉时空依赖性和空间扩散效应,预测未来PM2.5浓度。研究团队提出了一种基于图神经网络(GNN)和门控循环单元(GRU)的编码器-解码器架构,能够有效捕捉PM2.5浓度的时空动态变化。这些数据集对空气质量监测、环境科学和公共健康领域具有重要影响,为政策制定和早期预警系统提供了科学依据。
当前挑战
Bihar PM2.5 Dataset和KnowAir Dataset在构建和应用过程中面临多重挑战。首先,PM2.5浓度的预测问题具有高度复杂性,涉及多种气象和地理因素的相互作用,如风速、风向、温度等,这些因素对PM2.5的扩散和传输具有显著影响。其次,数据集的构建过程中,传感器数据的缺失和不一致性是一个常见问题,研究团队采用了多重插补法(MICE)来处理缺失数据,但仍可能影响模型的准确性。此外,时空预测模型需要同时捕捉时间和空间依赖性,这对模型的架构设计提出了较高要求。尽管提出的GNN-GRU架构在捕捉时空依赖性方面表现出色,但其计算复杂度较高,尤其是在处理大规模数据时,计算资源的限制可能成为瓶颈。最后,模型的泛化能力在不同地理区域和季节变化中的表现仍需进一步验证,以确保其在实际应用中的可靠性。
常用场景
经典使用场景
Bihar PM2.5 Dataset和KnowAir Dataset在空气质量监测领域具有广泛的应用,尤其是在细颗粒物(PM2.5)浓度的时空预测中。这些数据集通过覆盖印度比哈尔邦和中国严重污染区域的多点监测数据,为研究者提供了丰富的时空信息。经典的使用场景包括利用这些数据集训练和验证基于图神经网络(GNN)和门控循环单元(GRU)的时空预测模型,以捕捉PM2.5浓度的空间扩散和时间依赖性。
衍生相关工作
基于这些数据集,研究者们开发了多种经典的时空预测模型。例如,PM2.5-GNN模型通过结合图神经网络和门控循环单元,显著提升了PM2.5浓度的预测精度。此外,AirFormer模型利用Transformer架构进一步优化了预测性能。这些衍生工作不仅推动了空气质量预测领域的发展,还为其他时空预测问题提供了新的思路和方法。
数据集最近研究
最新研究方向
近年来,随着空气污染问题的日益严重,PM2.5浓度的时空预测成为了环境科学和机器学习领域的研究热点。Bihar PM2.5 Dataset和KnowAir Dataset作为两个重要的数据集,为研究者提供了丰富的时空数据,推动了基于图神经网络(GNN)和序列到序列(Seq2Seq)模型的创新。最新的研究聚焦于如何有效捕捉PM2.5浓度的空间扩散和时间依赖性。通过引入空间扩散引导的编码器-解码器架构,研究者成功地将图神经网络与门控循环单元(GRU)结合,显著提升了预测精度。这一方法不仅能够处理复杂的时空相关性,还能有效利用气象和地理信息,为空气质量管理提供了强有力的工具。此外,该模型在印度比哈尔邦和中国严重污染地区的应用,展示了其在不同地理环境下的泛化能力,为全球范围内的空气污染预测提供了新的思路。
相关研究论文
  • 1
    Spatio-Temporal Forecasting of PM2.5 via Spatial-Diffusion guided Encoder-Decoder Architecture印度理工学院坎普尔分校 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作