electricsheepafrica/africa-sensorsafrica-airquality-archive-kampala
收藏Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-sensorsafrica-airquality-archive-kampala
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为sensors.AFRICA Air Quality Archive Kampala,主要包含由低成本传感器采集的PM(颗粒物)、温度和湿度读数。数据集详细记录了传感器类型、日期、时间、位置信息以及具体的测量值(温度、湿度、PM1、PM2.5和PM10)。数据格式为CSV,适合研究空气质量和低成本传感器的研究人员使用。数据集的地理范围限定在乌干达的SENSORSAFRICA-AIRQUALITY-ARCHIVE区域,最后更新日期为2025-10-03。数据集由Electric Sheep Africa整理为适合机器学习的Parquet格式。
annotations_creators:
- 无标注
language_creators:
- 公开采集
language:
- 英语
license: CC BY 4.0
multilinguality:
- 单语言
size_categories:
- 1万<n<10万
source_datasets:
- 原创数据集
task_categories:
- 表格回归
- 其他
task_ids:
- 无
tags:
- 非洲
- 人道主义
- HDX
- Electric Sheep Africa
- pm1
- pm10
- pm2.5
- 湿度
- 温度
- sensorsafrica-airquality-archive
- 乌干达
pretty_name: "sensors.AFRICA 乌干达坎帕拉空气质量档案库"
dataset_info:
splits:
- name: train
num_examples: 13584
- name: test
num_examples: 3396
---
# sensors.AFRICA 乌干达坎帕拉空气质量档案库
**发布方**:sensors.AFRICA · **来源**:[OpenAfrica](https://open.africa/dataset/sensorsafrica-airquality-archive-kampala) · **许可协议**:`CC BY 4.0` · **最后更新**:2025-10-03
---
## 摘要
本数据集收录了由低成本颗粒物监测传感器采集的颗粒物(particulate matter,PM)、温度与湿度观测读数。此类传感器可监测空气中的PM浓度,涵盖直径≤1微米的颗粒物(PM1)、直径2.5微米的颗粒物(PM2.5)以及直径≤10微米的颗粒物(PM10)。
数据集包含传感器类型、读数日期、时间、位置信息,以及传感器测得的温度(摄氏度,℃)、湿度(百分比,%)、PM1、PM2.5与PM10的具体数值。本数据集非常适合致力于研究空气质量与PM监测用低成本传感器的科研人员与爱好者使用。
数据集以CSV格式存储,可通过Microsoft Excel、Google Sheets、LibreOffice Calc等编辑器打开。
请注意,数据集中的P0代表PM1,P2代表PM2.5,P1代表PM10。
本数据集的每一行均代表一个带地理定位的点位观测数据。原始数据最后在OpenAfrica平台更新于2025-10-03。地理覆盖范围:**SENSORSAFRICA-AIRQUALITY-ARCHIVE,乌干达**。
*本数据集已由[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)整理为适配机器学习的Parquet格式。*
---
## 数据集特征
| | |
|---|---|
| **领域** | 人道主义与发展数据 |
| **观测单元** | 带地理定位的点位观测数据 |
| **总行数** | 16980 |
| **列数** | 3(0个数值列、3个分类列、0个日期时间列) |
| **训练集划分** | 13584行 |
| **测试集划分** | 3396行 |
| **地理覆盖范围** | SENSORSAFRICA-AIRQUALITY-ARCHIVE,乌干达 |
| **发布方** | sensors.AFRICA |
| **OpenAfrica最后更新时间** | 2025-10-03 |
---
## 变量说明
**地理相关字段** — `sensor_id_sensor_type_location_lat_lon_timestamp_value_type_value`(示例值:42;SDS011;19;0.323;32.576;2018-02-21T07:24:27.103718+00:00;P2;22.10、42;SDS011;19;0.323;32.576;2018-02-26T11:28:35.445400+00:00;humidity;51.90、42;SDS011;19;0.323;32.576;2018-02-26T11:21:00.733059+00:00;P2;4.20)。
**标识符/元数据字段** — `esa_source`(HDX)、`esa_processed`(2026-04-27)。
---
## 快速上手
python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-sensorsafrica-airquality-archive-kampala")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
---
## 数据Schema
| 列名 | 数据类型 | 空值占比 | 取值范围/示例值 |
|---|---|---|---|
| `sensor_id_sensor_type_location_lat_lon_timestamp_value_type_value` | 对象型 | 0.0% | 42;SDS011;19;0.323;32.576;2018-02-21T07:24:27.103718+00:00;P2;22.10、42;SDS011;19;0.323;32.576;2018-02-26T11:28:35.445400+00:00;humidity;51.90、42;SDS011;19;0.323;32.576;2018-02-26T11:21:00.733059+00:00;P2;4.20 |
| `esa_source` | 对象型 | 0.0% | HDX |
| `esa_processed` | 对象型 | 0.0% | 2026-04-27 |
---
## 数值统计摘要
| 列名 | 最小值 | 最大值 | 均值 | 中位数 |
|---|---|---|---|---|
| 无数值列。 | | | | |
---
## 数据整理流程
原始数据通过CKAN API从OpenAfrica平台下载,并转换为Parquet格式。列名统一转为小写并标准化为蛇形命名法。常见的缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)被统一替换为`NaN`。本数据集以80/20的比例划分为训练集与测试集,使用固定随机种子(42)进行划分,并以Snappy压缩的Parquet格式存储。
---
## 局限性说明
- 数据源自sensors.AFRICA,未由Electric Sheep Africa(ESA)进行独立验证。
- 自动化清洗无法修正原始采集过程中错误上报的值、定义不一致问题或采样偏差。
- 本数据集覆盖2个国家;不同国家间的地理与方法学差异可能影响跨国家的可比性。
- 请查阅[原始HDX数据集页面](https://open.africa/dataset/sensorsafrica-airquality-archive-kampala)获取发布方提供的方法学说明与注意事项。
---
## 引用格式
bibtex
@dataset{openafrica_africa_sensorsafrica_airquality_archive_kampala,
title = {sensors.AFRICA Air Quality Archive Kampala},
author = {sensors.AFRICA},
year = {2025},
url = {https://open.africa/dataset/sensorsafrica-airquality-archive-kampala},
note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)}
}
---
*[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — 非洲的机器学习数据集基础设施,尼日利亚拉各斯。*
提供机构:
electricsheepafrica



