five

electricsheepafrica/africa-sensorsafrica-airquality-archive-akure

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-sensorsafrica-airquality-archive-akure
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含通过低成本传感器采集的PM(颗粒物)、温度和湿度读数。这些传感器测量空气中的PM浓度,包括直径小于或等于1微米(PM1)、2.5微米(PM2.5)和10微米(PM10)的颗粒。数据集还包括传感器类型、日期、时间、位置等信息,以及温度(℃)、湿度(%)、PM1、PM2.5和PM10的具体测量值。数据集以CSV格式存储,适合用于研究空气质量和低成本传感器在PM测量中的应用。数据集分为训练集(175个样本)和测试集(43个样本)。

annotations_creators: - 无注释 language_creators: - 公开获取 language: - 英语 license: - 其他许可 multilinguality: - 单语言 size_categories: - 样本量小于1000 source_datasets: - 原始数据集 task_categories: - 表格回归 - 其他 task_ids: [] tags: - 非洲 - 人道主义 - HDX(Humanitarian Data Exchange) - 电羊非洲(Electric Sheep Africa) - PM1 - PM10 - PM2.5 - 温度 - 湿度 - sensorsafrica-airquality-archive pretty_name: "sensors.AFRICA空气质量档案阿库雷数据集" dataset_info: splits: - name: 训练集 num_examples: 175 - name: 测试集 num_examples: 43 # sensors.AFRICA空气质量档案阿库雷数据集 **发布方:sensors.AFRICA · 来源:[OpenAfrica](https://open.africa/dataset/sensorsafrica-airquality-archive-akure) · 许可协议:`` · 最后更新:2026-04-27 --- ## 摘要 本数据集包含由低成本传感器采集的颗粒物(Particulate Matter,PM)、温度与湿度读数。此类传感器可检测空气中的颗粒物浓度,涵盖粒径≤1微米的颗粒物(PM1)、粒径2.5微米的颗粒物(PM2.5)以及粒径≤10微米的颗粒物(PM10)。数据集包含传感器类型、读数日期、时间、位置等信息,以及传感器针对温度(摄氏度,℃)、湿度(百分比,%)、PM1、PM2.5和PM10的具体测量值。本数据集适用于致力于研究空气质量与PM检测用低成本传感器的科研人员与爱好者。数据集以CSV格式存储,可通过Microsoft Excel、Google Sheets、LibreOffice Calc等编辑器打开。需注意:数据集中的P0对应PM1,P2对应PM2.5,P1对应PM10。 数据集中的每一行均代表一个带有地理定位的点位观测值。该数据集最后一次在OpenAfrica平台更新于2026年4月27日。地理覆盖范围:**SENSORSAFRICA-AIRQUALITY-ARCHIVE**。本数据集已由[电羊非洲(Electric Sheep Africa)](https://huggingface.co/electricsheepafrica)整理为适用于机器学习的Parquet格式。 --- ## 数据集特征 | | | |---|---| | **领域** | 人道主义与发展数据 | | **观测单元** | 地理定位点位观测值 | | **总行数** | 219 | | **列数** | 3(0个数值型、3个分类型、0个日期时间型) | | **训练集划分** | 175行 | | **测试集划分** | 43行 | | **地理覆盖范围** | SENSORSAFRICA-AIRQUALITY-ARCHIVE | | **发布方** | sensors.AFRICA | | **OpenAfrica最后更新时间** | 2026年4月27日 | --- ## 变量 **地理信息** — `sensor_id_sensor_type_location_lat_lon_timestamp_value_type_value`(示例值:4964;pms5003;4012;7.253;5.207;2025-09-29T17:02:53.762242+00:00;P2;16.80, 4965;DHT22;4012;7.253;5.207;2025-09-30T14:10:58.941126+00:00;humidity;68.30, 4965;DHT22;4012;7.253;5.207;2025-09-30T13:54:21.510524+00:00;temperature;33.80)。 **标识符/元数据** — `esa_source`(HDX(Humanitarian Data Exchange))、`esa_processed`(2026-04-27)。 --- ## 快速上手 python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-sensorsafrica-airquality-archive-akure") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() --- ## 数据模式 | 列名 | 数据类型 | 空值占比 | 取值范围/示例值 | |---|---|---|---| | `sensor_id_sensor_type_location_lat_lon_timestamp_value_type_value` | 对象型(object) | 0.0% | 4964;pms5003;4012;7.253;5.207;2025-09-29T17:02:53.762242+00:00;P2;16.80, 4965;DHT22;4012;7.253;5.207;2025-09-30T14:10:58.941126+00:00;humidity;68.30, 4965;DHT22;4012;7.253;5.207;2025-09-30T13:54:21.510524+00:00;temperature;33.80 | | `esa_source` | 对象型(object) | 0.0% | HDX | | `esa_processed` | 对象型(object) | 0.0% | 2026-04-27 | --- ## 数值型统计 | 列名 | 最小值 | 最大值 | 平均值 | 中位数 | |---|---|---|---|---| 无数值型列。 --- ## 数据整理 原始数据通过CKAN API从OpenAfrica平台下载,并转换为Parquet格式。列名统一转换为小写并采用蛇形命名法(snake_case)进行标准化。常见缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)被统一替换为`NaN`。本数据集以固定随机种子(42)按80/20的比例划分为训练集与测试集,并以Snappy压缩格式的Parquet文件存储。 --- ## 局限性 - 数据源自sensors.AFRICA,未经过电羊非洲(Electric Sheep Africa)的独立验证。 - 自动化清洗无法修正原始采集过程中上报错误的值、定义不一致或采样偏差问题。 - 请参阅[原始HDX数据集页面](https://open.africa/dataset/sensorsafrica-airquality-archive-akure)获取发布方提供的方法说明与注意事项。 --- ## 引用格式 bibtex @dataset{openafrica_africa_sensorsafrica_airquality_archive_akure, title = {sensors.AFRICA空气质量档案阿库雷数据集}, author = {sensors.AFRICA}, year = {2026}, url = {https://open.africa/dataset/sensorsafrica-airquality-archive-akure}, note = {由电羊非洲(Electric Sheep Africa)重新打包以适配机器学习需求(https://huggingface.co/electricsheepafrica)} } --- *[电羊非洲(Electric Sheep Africa)](https://huggingface.co/electricsheepafrica) — 非洲机器学习数据集基础设施。尼日利亚拉各斯。*
提供机构:
electricsheepafrica
二维码
社区交流群
二维码
科研交流群
商业服务