electricsheepafrica/africa-sensorsafrica-airquality-archive-abuja
收藏Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-sensorsafrica-airquality-archive-abuja
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含由低成本传感器在阿布贾测量的颗粒物(PM)、温度和湿度读数。传感器测量的颗粒物包括直径小于或等于1微米(PM1)、2.5微米(PM2.5)和10微米(PM10)的颗粒。数据集还包含传感器类型、日期、时间、位置以及温度(℃)、湿度(%)、PM1、PM2.5和PM10的具体测量值。数据集以CSV格式存储,适合研究空气质量和低成本传感器的研究人员使用。数据集已转换为Parquet格式,便于机器学习应用。
annotations_creators:
- 无注释
language_creators:
- 公开数据源采集
language:
- 英语
license: cc-by-4.0
multilinguality:
- 单语言
size_categories:
- 100K<n<1M
source_datasets:
- 原创数据集
task_categories:
- tabular-regression
- other
task_ids: []
tags:
- africa
- humanitarian
- hdx
- electric-sheep-africa
- sensorsafrica-airquality-archive
pretty_name: "sensors.AFRICA 阿布贾空气质量档案库"
dataset_info:
splits:
- name: train
num_examples: 165434
- name: test
num_examples: 41358
# sensors.AFRICA 阿布贾空气质量档案库
**发布方:** sensors.AFRICA · **数据源:** [OpenAfrica](https://open.africa/dataset/sensorsafrica-airquality-archive-abuja) · **授权协议:** `cc-by` · **最后更新时间:** 2026-04-27
---
## 摘要
本数据集包含由低成本传感器采集的颗粒物(Particulate Matter,PM)、温度与湿度读数。这些传感器可监测空气中的颗粒物浓度,涵盖直径≤1微米(PM1)、≤2.5微米(PM2.5)以及≤10微米(PM10)的颗粒物。
数据集包含传感器类型、读数日期、时间、位置信息,以及温度(摄氏度)、湿度(百分比)、PM1、PM2.5和PM10的具体测量值。本数据集非常适合致力于研究空气质量与颗粒物监测低成本传感器的研究人员与爱好者使用。
本数据集以CSV格式存储,可通过Microsoft Excel、Google Sheets、LibreOffice Calc等编辑器打开。
请注意,数据集中的P0代表PM1,P2代表PM2.5,P1代表PM10。
本数据集的每一行均代表带地理定位的点位观测数据。该数据集最后于OpenAfrica平台更新于2026年4月27日。地理覆盖范围:**SENSORSAFRICA-AIRQUALITY-ARCHIVE**。
*本数据集已由[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)整理为适用于机器学习的Parquet格式。*
---
## 数据集特征
| | |
|---|---|
| **领域** | 人道主义与发展数据 |
| **观测单元** | 带地理定位的点位观测数据 |
| **总行数** | 206,793 |
| **列数** | 3(0个数值型、3个分类型、0个日期时间型) |
| **训练集划分** | 165,434行 |
| **测试集划分** | 41,358行 |
| **地理覆盖范围** | SENSORSAFRICA-AIRQUALITY-ARCHIVE |
| **发布方** | sensors.AFRICA |
| **OpenAfrica最后更新时间** | 2026-04-27 |
---
## 变量
**地理信息** — `sensor_id_sensor_type_location_lat_lon_timestamp_value_type_value`(示例:4802;DHT22;3581;8.990;7.385;2022-11-07T12:18:30.943562+00:00;P2;22.50, 4803;pms5003;3581;8.990;7.385;2022-11-22T17:00:25.525419+00:00;P2;69.80, 4803;pms5003;3581;8.990;7.385;2022-11-22T16:59:21.249884+00:00;P2;75.20)。
**标识符/元数据** — `esa_source`(HDX)、`esa_processed`(2026-04-27)。
---
## 快速上手
python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-sensorsafrica-airquality-archive-abuja")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
---
## 数据模式
| 列名 | 数据类型 | 空值占比 | 取值范围/示例值 |
|---|---|---|---|
| `sensor_id_sensor_type_location_lat_lon_timestamp_value_type_value` | object | 0.0% | 4802;DHT22;3581;8.990;7.385;2022-11-07T12:18:30.943562+00:00;P2;22.50, 4803;pms5003;3581;8.990;7.385;2022-11-22T17:00:25.525419+00:00;P2;69.80, 4803;pms5003;3581;8.990;7.385;2022-11-22T16:59:21.249884+00:00;P2;75.20 |
| `esa_source` | object | 0.0% | HDX |
| `esa_processed` | object | 0.0% | 2026-04-27 |
---
## 数值型变量统计
| 列名 | 最小值 | 最大值 | 均值 | 中位数 |
|---|---|---|---|---|
*无数值型列。*
---
## 数据整理流程
原始数据通过CKAN API从OpenAfrica平台下载,并转换为Parquet格式。列名已转换为小写并标准化为蛇形命名法。常见的缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)已统一替换为`NaN`。本数据集使用固定随机种子(42)按80/20的比例划分为训练集与测试集,并以Snappy压缩格式保存为Parquet文件。
---
## 局限性
- 本数据源自sensors.AFRICA,尚未由Electric Sheep Africa(ESA)进行独立验证。
- 自动化清洗流程无法修正原始采集阶段的错误上报值、定义不一致问题或采样偏差。
- 请参阅[原始HDX数据集页面](https://open.africa/dataset/sensorsafrica-airquality-archive-abuja)获取发布方提供的方法说明与注意事项。
---
## 引用格式
bibtex
@dataset{openafrica_africa_sensorsafrica_airquality_archive_abuja,
title = {sensors.AFRICA Air Quality Archive Abuja},
author = {sensors.AFRICA},
year = {2026},
url = {https://open.africa/dataset/sensorsafrica-airquality-archive-abuja},
note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)}
}
---
*[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — 非洲机器学习数据集基础设施。尼日利亚拉各斯。*
提供机构:
electricsheepafrica



