electricsheepafrica/africa-who-population-with-access-to-an-insecticide-treated-bed-net
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-with-access-to-an-insecticide-treated-bed-net
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2015年至2024年间,世界卫生组织全球健康观察站(WHO GHO)关于人口使用杀虫剂处理蚊帐(ITN)预防疟疾的百分比(模型估计)的指标数据。数据来源于WHO GHO OData API,并以Parquet格式重新打包,包含数值估计、置信区间等信息。数据集覆盖37个非洲国家,共370行数据,每行数据包含国家代码、年份、数值估计等字段。
This dataset contains country-level observations for the WHO GHO indicator Population with access to an insecticide-treated bed net (ITN) for malaria protection (%), modelled across African nations, spanning 2015–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,专注于非洲地区国家层面经杀虫剂处理的蚊帐覆盖率(MALARIA_ITN_COVERAGE)指标。数据以Parquet格式整理,采用统一的模式架构,所有数值均源自高精度浮点字段NumericValue,而非显示字符串。同时纳入了置信区间上下界(value_low, value_high),为建模提供完整的不确定性信息。数据集覆盖2015至2024年间37个非洲国家的年度观测值,共计370条记录,且预先按WHO非洲区域(AFR)进行了过滤,确保数据的地理聚焦性。
特点
该数据集的核心特色在于其极简而精准的单一维度结构——每个国家每年仅对应一个无分层的数值,避免了因性别、年龄等亚组划分带来的复杂性,使得数据天然适合作为机器学习回归或分类任务的直接目标。此外,数据集不仅提供了点估计值,还附带了置信区间,有助于评估模型预测的不确定性。其一致性模式设计(如统一的ISO国家代码、WHO区域标识和完整的时间跨度)极大地方便了跨国家、跨年份的时间序列分析与对比研究。
使用方法
用户可通过HuggingFace的datasets库便捷加载数据,执行`load_dataset`命令后即可获得Pandas DataFrame格式的训练集。使用时建议先过滤出`dim1`字段为空或包含`_BTSX`(两性)的行,以获取全国层面的无分层数据。随后可按`country_iso3`字段筛选特定国家(如`KEN`表示肯尼亚),并依据`year`字段排序,轻松构建时间序列数据。该方法简洁高效,无需额外数据清洗,即可直接用于模型训练、趋势分析或可视化展示。
背景与挑战
背景概述
疟疾作为撒哈拉以南非洲地区长期面临的重大公共卫生威胁,其防控效果在很大程度上依赖于经杀虫剂处理蚊帐(ITN)的普及与使用。世界卫生组织全球卫生观察站(WHO GHO)自2015年起持续监测非洲各国ITN覆盖率,并于2024年由Electric Sheep Africa团队将其重新整理为机器学习就绪的数据集。该数据集聚焦于37个非洲国家2015至2024年间经模型估算的ITN覆盖百分比,为评估疟疾干预政策的成效提供了标准化、结构化的定量依据。其发布填补了非洲健康数据在机器学习领域可用性不足的空白,尤其为区域健康指标的时间序列分析、预测建模以及政策模拟研究奠定了坚实的数据基础,对推动数据驱动的公共卫生决策具有重要价值。
当前挑战
该数据集所解决的领域问题聚焦于疟疾防控中一个关键量化指标——ITN覆盖率的获取与建模。在非洲公共卫生领域,传统调查数据常因样本稀疏、时间不连续和跨国异质性而难以支撑精确的机器学习分析。此外,数据集构建过程中面临若干挑战:首先,WHO GHO原始数据以OData API形式提供,需进行系统化的抽取、清洗与格式统一才能转化为兼容的Parquet格式;其次,不同来源的置信区间、缺失值以及分层维度(如性别、城乡)需要精细处理,以保留统计信息同时维持结构一致性。这些挑战要求构建者具备公共卫生知识与数据工程能力的深度整合,最终产出不仅可用性强,且能支持高水平建模任务。
常用场景
经典使用场景
在疟疾防控研究中,该数据集最经典的使用场景是评估非洲各国疟疾保护措施覆盖率的时空演变趋势。研究者可借助其覆盖2015至2024年间37个非洲国家的年度观测值,构建面板数据模型,用于分析杀虫剂处理蚊帐(ITN)覆盖率的动态变化及其与气候、政策干预等因素的关联。通过整合置信区间信息,还可进行不确定性量化,为后续干预策略优化提供数据支撑。
衍生相关工作
该数据集衍生了一系列极具影响力的经典工作,包括利用机器学习模型预测未来覆盖率趋势的时序分析研究,以及结合地理空间数据构建的非洲疟疾风险图谱。此外,研究者还基于此数据集开发了涵盖社会经济变量的复合指数,用于量化ITN推广干预的成本效益,这些工作为全球基金和盖茨基金会等机构的拨款策略提供了关键证据。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区经杀虫剂处理蚊帐覆盖率的时空动态建模,已成为疟疾防控领域的前沿研究基石。结合WHO全球卫生观察站2015至2024年间37个非洲国家的追踪数据,研究者得以利用机器学习方法量化干预措施的实际效能,特别是在评估大规模蚊帐分发项目对疟疾发病率的因果效应方面具有里程碑意义。当前研究热点集中于融合气候变量、人口迁徙模式与卫生基础设施等多源数据,构建高精度预测模型以优化资源配置策略。该数据集提供的置信区间信息尤为珍贵,为不确定性量化及决策风险评估提供了可靠支撑,推动了循证公共卫生政策从描述性统计向预测性分析的范式转变。
以上内容由遇见数据集搜集并总结生成



