PM25Vision

Name: PM25Vision
Creator: 纽约大学计算机科学系
Published: 2025-09-20 11:51:45
License: 暂无描述

arXiv2025-09-20 更新2025-09-24 收录

下载链接：

https://huggingface.co/datasets/DeadCardassian/PM25Vision

下载链接

链接失效反馈

官方服务：

资源简介：

PM25Vision是一个大规模基准数据集，用于从街道级图像中估计空气质量，特别是PM2.5浓度。数据集包含超过11,114张图像，与3,261个空气质量监测站的PM2.5读数匹配，跨越了11年的时间，显著超过了之前基准的规模。该数据集的空间精度达到了5公里，远远超过了许多数据集的城市级精度。

PM25Vision is a large-scale benchmark dataset for estimating air quality, particularly PM2.5 concentration, from street-level imagery. The dataset contains over 11,114 images matched with PM2.5 readings from 3,261 air quality monitoring stations, spanning 11 years, which significantly exceeds the scale of previous benchmarks. Its spatial accuracy reaches 5 kilometers, far exceeding the urban-level precision of many other datasets.

提供机构：

纽约大学计算机科学系

创建时间：

2025-09-20

原始信息汇总

PM25Vision 数据集概述

数据集简介

PM25Vision (PM25V) 是一个用于从街景图像估计空气质量 (PM2.5) 的大规模数据集。该数据集将 Mapillary 照片与 世界空气质量指数 (WAQI) PM2.5 记录配对，覆盖时间范围为 2014 年至 2025 年，包含 3,261 个监测站，以及 11,114 张经过清洗和平衡的带有 PM2.5 AQI 标签的图像。

任务

回归：预测连续的 PM2.5 AQI 值。
分类：预测离散的 AQI 等级。

基准结果

回归任务

模型	R²	MAE	RMSE	Acc	F1
EfficientNet-B0	0.55	36.6	54.6	0.46	0.45
ResNet50	0.50	38.6	57.5	0.44	0.35
ViT-B/16	0.23	50.3	71.7	0.35	0.30

分类任务

模型	Acc	F1	Precision	Recall
ResNet50	0.44	0.38	0.48	0.37
ViT-B/16	0.40	0.37	0.41	0.36
EfficientNet-B0	0.40	0.34	0.42	0.33

数据字段说明

字段名	类型	描述
image_id	int64	唯一图像标识符 (来自 Mapillary)。
station_id	int64	WAQI 监测站 ID。
captured_at	object	图像拍摄日期 (YYYY-MM-DD)。
camera_angle	float64	相机方向 (如果可用)。
longitude	float64	监测站经度。
latitude	float64	监测站纬度。
quality_score	float64	Mapillary 图像质量评分 (如果可用)。
downloaded_at	object	样本下载时间戳。
pm25	float64	图像拍摄日当天的平均 PM2.5 AQI 值。
filename	object	图像文件名，位于 `images/` 目录下。
quality	object	ResNet18 分类的图像质量标签 (例如 `good` 或 `bad`)。
pm25_bin	object	离散的 AQI 等级标签 (例如 `0–50`, `51–100` 等)。

最常用的字段是 image_id 和 pm25。

数据划分

训练集：80% 的样本，在 AQI 区间内平衡。
测试集：20% 的样本，在 AQI 区间内平衡。

局限性

WAQI 时间分辨率为每日，可能无法捕捉日内变化。
空间精度限制在监测站周围 5 公里范围内。
罕见的极端 AQI 类别仍然代表性不足。

访问信息

论文链接：https://arxiv.org/abs/2509.16519
在线演示：http://www.pm25vision.com
Kaggle 数据集下载：https://www.kaggle.com/datasets/DeadCardassian/pm25vision

引用格式

bibtex @misc{han2025pm25visionlargescalebenchmarkdataset, title={PM25Vision: A Large-Scale Benchmark Dataset for Visual Estimation of Air Quality}, author={Yang Han}, year={2025}, eprint={2509.16519}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2509.16519}, }

许可证

许可证类型：cc-by-4.0

语言

语言：英语 (en)

规模类别

规模类别：10K<n<100K

任务类别

任务类别：图像分类 (image-classification), 其他 (other)

搜集汇总

数据集介绍

构建方式

在环境监测与计算机视觉交叉领域，PM25Vision数据集的构建体现了多源数据融合的前沿思路。该数据集通过整合全球最大空气质量项目WAQI的PM2.5历史数据与众包街景平台Mapillary的地理标记图像，建立了时空匹配机制。具体流程包括：首先筛选13,890个监测站中数据完整的站点，利用API获取其5公里范围内的街景图像，并通过日期匹配关联对应的PM2.5浓度值；随后采用基于ResNet18的图像质量分类器自动过滤无天空、过曝或夜间等无效图像，并结合样本平衡策略控制类别数量差异在五倍以内，最终从51.6万初始配对中提炼出1.1万张高质量样本。

特点

作为当前规模最大的视觉空气质量评估基准，PM25Vision展现出三大核心特征：其时空覆盖维度显著超越既往研究，囊括2014至2025年间3,261个监测站的全球数据，空间精度达5公里级；数据多样性通过严格的图像筛选与平衡处理得以保障，涵盖不同气候条件、地形特征和污染等级的街景场景；标签体系严格遵循美国环保署AQI分级标准，六个污染等级的样本分布经过科学调整，为模型训练提供均衡的监督信号。这些特性共同构筑了该数据集在细粒度环境感知任务中的独特价值。

使用方法

该数据集支持回归与分类双任务范式，用户可通过加载标准化数据拆分方案（8:2训练测试比）快速开展实验。针对PM2.5浓度预测任务，研究者可借鉴论文中EfficientNet-B0、ResNet50和ViT等基线模型的配置，进行端到端的图像特征提取与空气质量映射学习。对于分类任务，建议采用离散化AQI等级标签评估模型性能，重点关注F1分数与平衡准确率等指标。数据集文件包含图像元数据与PM2.5浓度时序标签，支持时空交叉验证等高级研究设计，同时提供在线预测服务接口便于实际应用部署。

背景与挑战

背景概述

空气污染作为全球性环境挑战，对公共卫生和生态系统构成严重威胁。传统PM2.5监测依赖固定站点，存在空间覆盖不足的局限性。2025年，纽约大学研究团队推出PM25Vision数据集，通过整合全球最大空气质量项目WAQI与街景平台Mapillary的数据，构建了包含11,114张图像与PM2.5浓度标注的大规模基准。该数据集覆盖3,261个监测站、时间跨度达11年，空间精度提升至5公里，为计算机视觉技术在环境监测领域的应用提供了重要基础设施。

当前挑战

该数据集致力于解决基于视觉的PM2.5浓度估计问题，核心挑战在于图像特征与空气质量指标间的非线性映射关系，需克服天气、光照、季节变化对视觉特征的干扰。构建过程中面临三重挑战：数据配对阶段需处理时空对齐精度问题，原始图像中存在三分之一无效样本（如无天空或夜间图像）；数据清洗环节通过训练ResNet18分类器实现自动化过滤；样本平衡方面遭遇严重类别不均衡，最终通过限制最大类别样本数不超过最小类别五倍的策略，将数据量从51万削减至1.1万以提升模型泛化能力。

常用场景

解决学术问题

该数据集有效解决了传统空气质量监测中空间分辨率不足的学术难题。固定监测站分布稀疏导致无法捕捉城市内部的细粒度污染变化，而PM25Vision通过5公里精度的地理匹配，实现了从城市级到街区级的空间尺度突破。其大规模跨时空样本支持模型学习不同气候条件、地理特征下的污染表征规律，为计算机视觉模型在环境感知领域的泛化能力验证提供了重要基准，显著提升了基于图像的PM2.5预测研究的可复现性与可比性。

衍生相关工作

基于该数据集的基准测试催生了多项创新研究，如采用EfficientNet-B0的回归模型在PM2.5值预测任务中达到0.55的R²分数。这些工作深化了对卷积神经网络与Transformer架构在环境视觉任务中性能差异的认知，推动了注意力机制等技术在污染特征提取中的应用。数据集构建过程中提出的基于ResNet18的图像质量过滤方法，也为类似跨模态数据清洗任务提供了技术范式，启发了后续研究对数据质量的系统性控制。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集