HVAQ
收藏arXiv2021-10-16 更新2024-06-21 收录
下载链接:
https://github.com/implicitDeclaration/HVAQ-dataset/tree/master
下载链接
链接失效反馈官方服务:
资源简介:
HVAQ数据集是由浙江工业大学网络空间安全研究所创建的高时空分辨率空气质量数据集,包含PM2.5、PM10、温度和湿度数据,以及同步的点传感器测量和对应图像。该数据集首次公开,旨在支持高空间分辨率图像空气质量评估算法的研究。数据集不仅包含高精度的污染测量数据,还提供了GPS位置、湿度、温度等辅助信息,适用于训练和评估基于视觉的污染估计和预测技术。HVAQ数据集的应用领域广泛,主要用于解决空气质量监测中由于传感器稀疏部署导致的污染场估计不准确问题,特别是在城市环境中,通过提高传感器密度和利用图像传感器,可以显著提高污染浓度场的估计精度和分辨率。
The HVAQ dataset is a high spatiotemporal resolution air quality dataset developed by the Cyberspace Security Research Institute of Zhejiang University of Technology. It contains PM2.5, PM10, temperature, and humidity data, as well as synchronized point sensor measurements and corresponding images. This is the first public release of the dataset, which is intended to support research on high spatial resolution image-based air quality assessment algorithms. In addition to high-precision pollution measurement data, the dataset also provides auxiliary information such as GPS location, humidity, and temperature, making it suitable for training and evaluating vision-based pollution estimation and prediction technologies. The HVAQ dataset has a wide range of applications, primarily aimed at solving the problem of inaccurate pollution field estimation caused by sparse sensor deployment in air quality monitoring. Particularly in urban environments, increasing sensor density and leveraging image sensors can significantly improve the estimation accuracy and resolution of pollution concentration fields.
提供机构:
浙江工业大学网络空间安全研究所
创建时间:
2021-02-18
搜集汇总
数据集介绍

构建方式
在空气污染监测领域,传统传感器部署稀疏,难以捕捉污染物在空间上的快速变化。HVAQ数据集的构建采用了创新的多传感器协同采集策略,在杭州市区部署了十个高精度颗粒物传感器,每平方公里平均分布2.5个监测点,实现了高达秒级时间分辨率的连续数据采集。同时,通过搭载在无人机及固定山顶的摄像设备,同步获取覆盖所有传感器位置的广角图像,确保了视觉数据与地面实测数据在时空上严格对齐。传感器经过与气象局标准站的共位校准,采用分段线性函数进行数据校正,显著提升了测量准确性,最终形成了包含颗粒物浓度、温湿度及对应图像的多元数据集。
特点
HVAQ数据集的核心特点在于其高时空分辨率与多模态数据的融合。作为首个公开提供同步点传感器测量与对应图像的数据集,它实现了每平方公里2.5个传感器的高密度布局,以及秒级时间采样,突破了传统监测网络的空间局限性。数据集不仅包含PM2.5、PM10的精确浓度,还整合了温度、湿度等环境参数,为研究污染物空间异质性提供了丰富信息。其图像数据涵盖不同海拔视角,从地面固定点到无人机高空拍摄,完整捕捉了视觉霾效应与污染分布的关联,为基于视觉的污染估计算法提供了前所未有的高分辨率验证基础。
使用方法
该数据集主要应用于基于视觉的空气污染估计算法的训练与评估。研究人员可利用其同步的图像与传感器数据,开发或验证利用暗通道先验、灰度图像标准差等视觉特征估计PM2.5浓度的模型。通过有选择地屏蔽部分传感器数据,可以模拟不同传感器密度下的估计性能,进而分析空间分辨率对算法精度的影响。数据集中包含的高空与低空图像子集,允许分别探索不同视角下视觉特征的适用性。此外,数据集支持随机森林回归、梯度提升回归等机器学习方法的性能比较,为优化监测网络部署与视觉感知技术的融合提供实证依据。
背景与挑战
背景概述
空气污染对人类健康构成严重威胁,其中细颗粒物(PM2.5)等污染物与心血管及呼吸系统疾病密切相关。传统监测方法依赖稀疏部署的固定传感器,难以捕捉污染物在空间上的快速变化。在此背景下,HVAQ数据集应运而生,由浙江工业大学与密歇根大学的研究团队于2021年联合创建,旨在通过结合高分辨率点传感器数据与同步图像,推动基于视觉的空气污染估计算法研究。该数据集首次公开提供了每2.5平方公里一个传感器的高空间分辨率及每秒一次的高时间分辨率PM2.5、PM10、温度与湿度测量数据,并辅以对应图像,为评估视觉污染估计技术提供了关键基准,对提升环境监测精度与空间覆盖具有重要影响力。
当前挑战
HVAQ数据集致力于解决基于视觉的空气污染浓度估计问题,其核心挑战在于传统方法因地面真值数据空间分辨率低而难以准确评估算法性能。污染物分布受风速、湿度及地理因素影响,在短距离内呈现显著异质性,导致稀疏传感器网络无法反映真实污染场。构建过程中,研究团队面临传感器校准、数据同步与图像采集等多重困难。例如,需通过共定位方法校准粒子计数器以减少测量误差,同时利用无人机与固定摄像头获取覆盖所有传感器位置的广角图像,并确保时间戳对齐。此外,图像数据受天气条件(如雨雪)干扰,可能被误判为污染,增加了算法鲁棒性设计的复杂度。
常用场景
经典使用场景
在环境科学与计算机视觉交叉领域,HVAQ数据集为基于视觉的空气质量估计算法提供了高分辨率评估基准。该数据集通过同步采集点传感器测量数据与对应图像,使得研究人员能够首次在精细空间尺度上验证图像分析技术对PM2.5和PM10浓度预测的准确性。经典应用场景包括利用暗通道先验和灰度图像标准差等视觉特征,结合机器学习模型如梯度提升回归,从航拍或地面图像中反演污染物的空间分布,从而弥补传统监测站点稀疏部署的局限性。
解决学术问题
HVAQ数据集解决了空气污染监测中高分辨率地面真值数据缺失的核心学术问题。传统监测方法因传感器空间密度不足,难以捕捉污染物快速变化的异质性分布,导致基于视觉的估计算法缺乏可靠验证依据。该数据集通过提供每2.5平方公里一个传感器的高空间分辨率及每秒采样的高时间分辨率数据,首次实现了对图像驱动污染估计技术的量化评估,揭示了污染物浓度与距离的空间相关性,并验证了增加传感器密度与引入图像信息对提升估计精度的显著作用。
衍生相关工作
HVAQ数据集催生了多项跨学科经典研究,推动了视觉污染估计技术的演进。基于该数据集,研究者扩展了暗通道先验与散射模型在污染浓度反演中的应用,并发展了融合多源数据的集成学习框架。相关工作如Zhang等人提出的卷积神经网络污染等级预测方法,以及Rijal等人设计的神经网络集成模型,均在HVAQ提供的高分辨率真值数据上得到验证与优化。这些衍生工作进一步促进了环境感知与人工智能技术的深度融合,为智慧城市监测系统奠定了算法基础。
以上内容由遇见数据集搜集并总结生成



