electricsheepafrica/africa-who-financing
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-financing
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含WHO GHO指标Financing(IHRSPAR2_C03)在非洲国家2021-2023年的国家层面观测数据。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Financing (IHRSPAR2_C03) across African nations, spanning 2021–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家在2021至2023年间关于“融资”(Financing)指标的观测数据。数据经过精心抽取与整理,以Parquet文件格式存储,并采用一致的架构设计。所有数值均来自高精度的NumericValue字段,而非显示字符串,同时保留了可用的置信区间上下界(value_low与value_high),确保了数据精度与可靠性。数据集共计141条记录,覆盖47个非洲国家,且严格限定于WHO AFRO区域,为机器学习任务提供了干净、结构化、即用型的数据基础。
特点
该数据集的核心特点在于其简洁性与一致性:每个国家-年份组合仅对应单一条目,无额外子维度分层,大幅降低了数据复杂性,便于直接进行建模与分析。数据集包含丰富的字段信息,除了核心的目标变量value_numeric外,还提供置信区间、区域代码、国家ISO代码及更新时间戳等元数据,支持多样化的时序与横截面分析。同时,数据集作为Electric Sheep Africa系列的一部分,遵循CC BY 4.0许可协议,保证了开放共享与合法复用,特别适合用于非洲公共卫生领域的分类与回归任务。
使用方法
数据集可通过HuggingFace的datasets库轻松加载,使用load_dataset('electricsheepafrica/africa-who-financing')即可获取。加载后可转换为Pandas DataFrame进行进一步处理。用户可根据维度字段dim1过滤出特定子集,例如通过筛选dim1以'_BTSX'结尾的条目来获取男女合计的国家级数据。此外,针对单一国家的时间序列分析,可按country_iso3字段筛选并通过year排序。数据集结构清晰,支持快速的探索性数据分析、模型训练与评估,是研究非洲卫生融资状况的理想资源。
背景与挑战
背景概述
在全球公共卫生治理的宏大叙事中,卫生筹资能力是衡量一个国家应对突发公共卫生事件(如疫情、自然灾害)的核心指标。世界卫生组织(WHO)通过《国际卫生条例》监测框架,构建了包含多项核心能力的评估体系。其中,“筹资”(Financing)指标(代码IHRSPAR2_C03)旨在评估成员国为履行其卫生安全义务而配置的财政资源。该数据集由Electric Sheep Africa团队于2023年整理发布,数据源自WHO全球卫生观察站(GHO)的官方API,覆盖2021至2023年间47个非洲国家的141条观测记录。通过统一的数据模式(Parquet格式)和标准化字段(如点估计值、置信区间),该数据集为机器学习驱动的非洲卫生系统研究提供了高质量、可复用的基础数据,有力推动了数据驱动的卫生政策分析与区域比较研究。
当前挑战
该数据集所应对的领域挑战在于,非洲国家卫生筹资数据的分散与不兼容性严重阻碍了区域性的卫生安全分析与机器学习建模。原始数据散落于各国家报告或异构的WHO接口中,缺乏统一的、机器可读的格式,导致跨国家、跨年份的量化分析难以展开。在数据构建过程中,团队面临了多重挑战:首先,需从WHO GHO的OData API中精准提取“NumericalValue”字段,而非易歧义的显示字符串,以确保数值精度;其次,需处理置信区间缺失值、维度(如性别、居住地类型)的分层结构,以及时间跨度短(仅3年)带来的稀疏性问题;此外,还需确保47个国家代码的完整性与一致性,并最终将异构数据整合为符合ML pipeline标准的Parquet格式,这些步骤共同构成了模型训练可靠性的关键瓶颈。
常用场景
经典使用场景
该数据集聚焦于非洲国家在2021年至2023年间卫生融资状况的定量刻画,涵盖47个国家的观测数据。其经典应用在于构建基于时间序列与跨国比较的监督学习模型,如回归分析用以预测卫生融资水平的高低,或分类任务用以识别不同融资瓶颈模式。研究者可借助这一结构化面板数据,深入剖析卫生投入在非洲大陆的时空演变规律,为资源分配与政策评估提供坚实的数据基础。
衍生相关工作
以该数据集为基础,衍生出了一系列围绕非洲卫生融资展开的经典工作。例如,研究者将其与WHO其他健康指标体系融合,构建多任务学习框架以同时预测多项健康产出指标。亦有工作基于其时间序列特征,采用LSTM或Transformer模型进行短期卫生支出预测。此外,该数据集被用于检验卫生融资与疾病负担之间的因果关系,催生了因果推断与反事实分析方向的前沿探索。
数据集最近研究
最新研究方向
在非洲公共卫生体系效能评估的前沿研究中,该数据集聚焦于国际卫生条例(IHR)核心能力领域的资金可持续性监测。结合2023年WHO非洲区域办事处发布的《非洲卫生紧急情况报告》热点,研究者正利用该2021-2023年覆盖47国的时序数据,构建基于机器学习的时间序列预测模型,以解析后疫情时代非洲国家卫生融资波动与突发公共卫生事件应对能力的动态关联。其标准化Parquet格式与置信区间字段,为跨区域卫生经济学的多层贝叶斯推断提供了高质量数据基底,推动了从描述性统计到因果推断的方法论跃迁,对全球卫生安全框架下的资源分配优化具有范式意义。
以上内容由遇见数据集搜集并总结生成



