five

electricsheepafrica/africa-who-number-of-people-protected-from-malaria-by-indoor-residual

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-people-protected-from-malaria-by-indoor-residual
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(GHO)指标通过室内残留喷洒(IRS)保护免受疟疾侵害的人数(MALARIA_IRS_COVERAGE)在非洲各国的观测数据,时间跨度为2015年至2024年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO GHO OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖33个非洲国家,共243行数据。

This dataset contains country-level observations for the WHO GHO indicator Number of people protected from malaria by indoor residual spraying (IRS) (MALARIA_IRS_COVERAGE) across African nations, spanning 2015–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 33 African nations with a total of 243 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,聚焦于非洲地区通过室内滞留喷洒(IRS)免受疟疾威胁的人口数量。数据经系统化采集与重构,采用Parquet文件格式存储,并遵循统一的模式规范。所有数值均来源于浮点精度的NumericValue字段,而非字符串形式的展示值,同时收录了置信区间上下界(value_low与value_high)等统计信息。数据覆盖2015至2024年间33个非洲国家的243条观测记录,仅纳入WHO非洲区域(AFR)的样本,每个国家与年份的组合对应单一数值,无额外维度分层。
特点
该数据集的核心特点在于其高度的结构化与机器学习就绪性。列架构清晰,包含指标代码、国家ISO代码、WHO区域、年份、点估计值、置信区间、展示字符串及维度类型等字段,便于直接进行时间序列分析与回归建模。数据来源权威,经WHO官方授权并以CC BY 4.0许可开放,同时由Electric Sheep Africa团队重新打包,确保跨数据集的一致性。此外,数据集体积小巧(n<1K),适合快速实验与原型验证,特别适用于关注非洲公共卫生领域的分类与回归任务。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据,使用`load_dataset`函数直接获取训练集。加载后的数据可转换为Pandas DataFrame以便进行灵活操作,例如通过筛选dim1字段中`_BTSX`结尾或为空的行来提取全国性且涵盖两性的数据。针对特定国家的时间序列分析,可依据country_iso3列(如'KEN'代表肯尼亚)过滤并按年份排序。数据集无缺失子维度,单一年份与国家组合对应唯一值,降低了预处理复杂度,适用于快速构建基线模型或探索性数据分析。
背景与挑战
背景概述
疟疾作为非洲大陆最为严峻的公共卫生威胁之一,其防控措施的成效评估对于全球健康治理具有重要意义。世界卫生组织全球卫生观测站(WHO GHO)发布的这一数据集,聚焦于通过室内滞留喷洒(IRS)获得保护的非洲人口数量,覆盖33个非洲国家2015至2024年的年度观测数据。该数据集由Electric Sheep Africa团队整理自WHO官方OData API,以统一架构的Parquet格式重新打包,旨在为机器学习应用提供标准化、即用型的非洲健康数据资源。其核心研究问题在于量化IRS这一关键干预措施在不同国家和时间维度上的覆盖范围与保护效果,为疟疾防控策略的制定与优化提供数据支撑,对推动非洲地区精准公共卫生决策具有重要价值。
当前挑战
该数据集面对的领域挑战在于疟疾防控的复杂时空异质性:室内滞留喷洒的实际保护效果受蚊虫抗药性、居民行为模式及地理环境等多重因素交织影响,单纯依赖人口覆盖数值难以全面评估干预的真实效能。构建过程中的核心挑战首先体现在数据质量方面,WHO原始数据中部分观测值包含置信区间,缺失值与异常值的存在增加了数据清洗与处理的难度。其次,数据覆盖范围有限(243个观测值),且无子维度细分(如年龄、性别分层),限制了深入分析能力。此外,跨年度与国别的数据结构一致性维护、API数据更新的时滞性,以及将官方统计格式转化为机器学习友好型特征工程的复杂过程,均对数据集的准确性和可用性构成了严峻考验。
常用场景
经典使用场景
该数据集记录了2015年至2024年间33个非洲国家通过室内滞留喷洒(IRS)获得疟疾保护的人口数量,是评估非洲地区疟疾防控覆盖率的标准化时序观测数据。研究者常将其作为核心因变量,分析IRS干预措施在不同国家与年份间的实施广度与变化趋势,或将其与气候、经济、卫生系统等协变量结合,构建面板数据模型以探讨影响防控成效的多维驱动因素。
解决学术问题
该数据集精准回应了全球公共卫生领域关于虫媒传染病防控效果量化的核心难题——即如何系统性地获取跨国家、跨年度的IRS保护人口数据以支撑实证研究。它助力学界解析IRS策略在非洲的覆盖率演变、区域差异及其与疟疾发病率下降的统计关联,为推动基于证据的疟疾消除策略优化、评估全球基金及国家疾控项目的实际执行成效提供了不可替代的数据基石。
衍生相关工作
围绕该数据集衍生的经典工作包括利用时序回归或贝叶斯结构时间序列模型评估国家层面IRS覆盖度的变化拐点,或将保护人口数标准化为人均覆盖率后与疟疾发病监测数据联动,开展干预效果的事后因果推断研究。此外,部分研究将其作为联合国可持续发展目标(SDG 3.3)疟疾防控进程的追踪指标,进而驱动了非洲区域疟疾防控预测预警系统的开发与迭代。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务