five

electricsheepafrica/africa-sensorsafrica-airquality-archive-kampala

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-sensorsafrica-airquality-archive-kampala
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为sensors.AFRICA Air Quality Archive Kampala,主要包含由低成本传感器采集的PM(颗粒物)、温度和湿度读数。数据集详细记录了传感器类型、日期、时间、位置信息以及具体的测量值(温度、湿度、PM1、PM2.5和PM10)。数据格式为CSV,适合研究空气质量和低成本传感器的研究人员使用。数据集的地理范围限定在乌干达的SENSORSAFRICA-AIRQUALITY-ARCHIVE区域,最后更新日期为2025-10-03。数据集由Electric Sheep Africa整理为适合机器学习的Parquet格式。

annotations_creators: - 无标注 language_creators: - 公开采集 language: - 英语 license: CC BY 4.0 multilinguality: - 单语言 size_categories: - 1万<n<10万 source_datasets: - 原创数据集 task_categories: - 表格回归 - 其他 task_ids: - 无 tags: - 非洲 - 人道主义 - HDX - Electric Sheep Africa - pm1 - pm10 - pm2.5 - 湿度 - 温度 - sensorsafrica-airquality-archive - 乌干达 pretty_name: "sensors.AFRICA 乌干达坎帕拉空气质量档案库" dataset_info: splits: - name: train num_examples: 13584 - name: test num_examples: 3396 --- # sensors.AFRICA 乌干达坎帕拉空气质量档案库 **发布方**:sensors.AFRICA · **来源**:[OpenAfrica](https://open.africa/dataset/sensorsafrica-airquality-archive-kampala) · **许可协议**:`CC BY 4.0` · **最后更新**:2025-10-03 --- ## 摘要 本数据集收录了由低成本颗粒物监测传感器采集的颗粒物(particulate matter,PM)、温度与湿度观测读数。此类传感器可监测空气中的PM浓度,涵盖直径≤1微米的颗粒物(PM1)、直径2.5微米的颗粒物(PM2.5)以及直径≤10微米的颗粒物(PM10)。 数据集包含传感器类型、读数日期、时间、位置信息,以及传感器测得的温度(摄氏度,℃)、湿度(百分比,%)、PM1、PM2.5与PM10的具体数值。本数据集非常适合致力于研究空气质量与PM监测用低成本传感器的科研人员与爱好者使用。 数据集以CSV格式存储,可通过Microsoft Excel、Google Sheets、LibreOffice Calc等编辑器打开。 请注意,数据集中的P0代表PM1,P2代表PM2.5,P1代表PM10。 本数据集的每一行均代表一个带地理定位的点位观测数据。原始数据最后在OpenAfrica平台更新于2025-10-03。地理覆盖范围:**SENSORSAFRICA-AIRQUALITY-ARCHIVE,乌干达**。 *本数据集已由[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)整理为适配机器学习的Parquet格式。* --- ## 数据集特征 | | | |---|---| | **领域** | 人道主义与发展数据 | | **观测单元** | 带地理定位的点位观测数据 | | **总行数** | 16980 | | **列数** | 3(0个数值列、3个分类列、0个日期时间列) | | **训练集划分** | 13584行 | | **测试集划分** | 3396行 | | **地理覆盖范围** | SENSORSAFRICA-AIRQUALITY-ARCHIVE,乌干达 | | **发布方** | sensors.AFRICA | | **OpenAfrica最后更新时间** | 2025-10-03 | --- ## 变量说明 **地理相关字段** — `sensor_id_sensor_type_location_lat_lon_timestamp_value_type_value`(示例值:42;SDS011;19;0.323;32.576;2018-02-21T07:24:27.103718+00:00;P2;22.10、42;SDS011;19;0.323;32.576;2018-02-26T11:28:35.445400+00:00;humidity;51.90、42;SDS011;19;0.323;32.576;2018-02-26T11:21:00.733059+00:00;P2;4.20)。 **标识符/元数据字段** — `esa_source`(HDX)、`esa_processed`(2026-04-27)。 --- ## 快速上手 python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-sensorsafrica-airquality-archive-kampala") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() --- ## 数据Schema | 列名 | 数据类型 | 空值占比 | 取值范围/示例值 | |---|---|---|---| | `sensor_id_sensor_type_location_lat_lon_timestamp_value_type_value` | 对象型 | 0.0% | 42;SDS011;19;0.323;32.576;2018-02-21T07:24:27.103718+00:00;P2;22.10、42;SDS011;19;0.323;32.576;2018-02-26T11:28:35.445400+00:00;humidity;51.90、42;SDS011;19;0.323;32.576;2018-02-26T11:21:00.733059+00:00;P2;4.20 | | `esa_source` | 对象型 | 0.0% | HDX | | `esa_processed` | 对象型 | 0.0% | 2026-04-27 | --- ## 数值统计摘要 | 列名 | 最小值 | 最大值 | 均值 | 中位数 | |---|---|---|---|---| | 无数值列。 | | | | | --- ## 数据整理流程 原始数据通过CKAN API从OpenAfrica平台下载,并转换为Parquet格式。列名统一转为小写并标准化为蛇形命名法。常见的缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)被统一替换为`NaN`。本数据集以80/20的比例划分为训练集与测试集,使用固定随机种子(42)进行划分,并以Snappy压缩的Parquet格式存储。 --- ## 局限性说明 - 数据源自sensors.AFRICA,未由Electric Sheep Africa(ESA)进行独立验证。 - 自动化清洗无法修正原始采集过程中错误上报的值、定义不一致问题或采样偏差。 - 本数据集覆盖2个国家;不同国家间的地理与方法学差异可能影响跨国家的可比性。 - 请查阅[原始HDX数据集页面](https://open.africa/dataset/sensorsafrica-airquality-archive-kampala)获取发布方提供的方法学说明与注意事项。 --- ## 引用格式 bibtex @dataset{openafrica_africa_sensorsafrica_airquality_archive_kampala, title = {sensors.AFRICA Air Quality Archive Kampala}, author = {sensors.AFRICA}, year = {2025}, url = {https://open.africa/dataset/sensorsafrica-airquality-archive-kampala}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — 非洲的机器学习数据集基础设施,尼日利亚拉各斯。*
提供机构:
electricsheepafrica
二维码
社区交流群
二维码
科研交流群
商业服务