electricsheepafrica/africa-sensorsafrica-airquality-archive-akure
收藏Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-sensorsafrica-airquality-archive-akure
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含通过低成本传感器采集的PM(颗粒物)、温度和湿度读数。这些传感器测量空气中的PM浓度,包括直径小于或等于1微米(PM1)、2.5微米(PM2.5)和10微米(PM10)的颗粒。数据集还包括传感器类型、日期、时间、位置等信息,以及温度(℃)、湿度(%)、PM1、PM2.5和PM10的具体测量值。数据集以CSV格式存储,适合用于研究空气质量和低成本传感器在PM测量中的应用。数据集分为训练集(175个样本)和测试集(43个样本)。
annotations_creators:
- 无注释
language_creators:
- 公开获取
language:
- 英语
license:
- 其他许可
multilinguality:
- 单语言
size_categories:
- 样本量小于1000
source_datasets:
- 原始数据集
task_categories:
- 表格回归
- 其他
task_ids: []
tags:
- 非洲
- 人道主义
- HDX(Humanitarian Data Exchange)
- 电羊非洲(Electric Sheep Africa)
- PM1
- PM10
- PM2.5
- 温度
- 湿度
- sensorsafrica-airquality-archive
pretty_name: "sensors.AFRICA空气质量档案阿库雷数据集"
dataset_info:
splits:
- name: 训练集
num_examples: 175
- name: 测试集
num_examples: 43
# sensors.AFRICA空气质量档案阿库雷数据集
**发布方:sensors.AFRICA · 来源:[OpenAfrica](https://open.africa/dataset/sensorsafrica-airquality-archive-akure) · 许可协议:`` · 最后更新:2026-04-27
---
## 摘要
本数据集包含由低成本传感器采集的颗粒物(Particulate Matter,PM)、温度与湿度读数。此类传感器可检测空气中的颗粒物浓度,涵盖粒径≤1微米的颗粒物(PM1)、粒径2.5微米的颗粒物(PM2.5)以及粒径≤10微米的颗粒物(PM10)。数据集包含传感器类型、读数日期、时间、位置等信息,以及传感器针对温度(摄氏度,℃)、湿度(百分比,%)、PM1、PM2.5和PM10的具体测量值。本数据集适用于致力于研究空气质量与PM检测用低成本传感器的科研人员与爱好者。数据集以CSV格式存储,可通过Microsoft Excel、Google Sheets、LibreOffice Calc等编辑器打开。需注意:数据集中的P0对应PM1,P2对应PM2.5,P1对应PM10。
数据集中的每一行均代表一个带有地理定位的点位观测值。该数据集最后一次在OpenAfrica平台更新于2026年4月27日。地理覆盖范围:**SENSORSAFRICA-AIRQUALITY-ARCHIVE**。本数据集已由[电羊非洲(Electric Sheep Africa)](https://huggingface.co/electricsheepafrica)整理为适用于机器学习的Parquet格式。
---
## 数据集特征
| | |
|---|---|
| **领域** | 人道主义与发展数据 |
| **观测单元** | 地理定位点位观测值 |
| **总行数** | 219 |
| **列数** | 3(0个数值型、3个分类型、0个日期时间型) |
| **训练集划分** | 175行 |
| **测试集划分** | 43行 |
| **地理覆盖范围** | SENSORSAFRICA-AIRQUALITY-ARCHIVE |
| **发布方** | sensors.AFRICA |
| **OpenAfrica最后更新时间** | 2026年4月27日 |
---
## 变量
**地理信息** — `sensor_id_sensor_type_location_lat_lon_timestamp_value_type_value`(示例值:4964;pms5003;4012;7.253;5.207;2025-09-29T17:02:53.762242+00:00;P2;16.80, 4965;DHT22;4012;7.253;5.207;2025-09-30T14:10:58.941126+00:00;humidity;68.30, 4965;DHT22;4012;7.253;5.207;2025-09-30T13:54:21.510524+00:00;temperature;33.80)。
**标识符/元数据** — `esa_source`(HDX(Humanitarian Data Exchange))、`esa_processed`(2026-04-27)。
---
## 快速上手
python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-sensorsafrica-airquality-archive-akure")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
---
## 数据模式
| 列名 | 数据类型 | 空值占比 | 取值范围/示例值 |
|---|---|---|---|
| `sensor_id_sensor_type_location_lat_lon_timestamp_value_type_value` | 对象型(object) | 0.0% | 4964;pms5003;4012;7.253;5.207;2025-09-29T17:02:53.762242+00:00;P2;16.80, 4965;DHT22;4012;7.253;5.207;2025-09-30T14:10:58.941126+00:00;humidity;68.30, 4965;DHT22;4012;7.253;5.207;2025-09-30T13:54:21.510524+00:00;temperature;33.80 |
| `esa_source` | 对象型(object) | 0.0% | HDX |
| `esa_processed` | 对象型(object) | 0.0% | 2026-04-27 |
---
## 数值型统计
| 列名 | 最小值 | 最大值 | 平均值 | 中位数 |
|---|---|---|---|---|
无数值型列。
---
## 数据整理
原始数据通过CKAN API从OpenAfrica平台下载,并转换为Parquet格式。列名统一转换为小写并采用蛇形命名法(snake_case)进行标准化。常见缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)被统一替换为`NaN`。本数据集以固定随机种子(42)按80/20的比例划分为训练集与测试集,并以Snappy压缩格式的Parquet文件存储。
---
## 局限性
- 数据源自sensors.AFRICA,未经过电羊非洲(Electric Sheep Africa)的独立验证。
- 自动化清洗无法修正原始采集过程中上报错误的值、定义不一致或采样偏差问题。
- 请参阅[原始HDX数据集页面](https://open.africa/dataset/sensorsafrica-airquality-archive-akure)获取发布方提供的方法说明与注意事项。
---
## 引用格式
bibtex
@dataset{openafrica_africa_sensorsafrica_airquality_archive_akure,
title = {sensors.AFRICA空气质量档案阿库雷数据集},
author = {sensors.AFRICA},
year = {2026},
url = {https://open.africa/dataset/sensorsafrica-airquality-archive-akure},
note = {由电羊非洲(Electric Sheep Africa)重新打包以适配机器学习需求(https://huggingface.co/electricsheepafrica)}
}
---
*[电羊非洲(Electric Sheep Africa)](https://huggingface.co/electricsheepafrica) — 非洲机器学习数据集基础设施。尼日利亚拉各斯。*
提供机构:
electricsheepafrica



