electricsheepafrica/africa-who-domestic-general-government-expenditure-on-phc-as-of
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-domestic-general-government-expenditure-on-phc-as-of
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2016年至2023年间,政府在国内初级卫生保健(PHC)支出占初级卫生保健总支出(PHCE)百分比的国家级观测数据。数据来源于WHO Global Health Observatory,并以Parquet文件格式重新打包,包含数值估计和置信区间等信息。数据集覆盖40个非洲国家,共196行数据。
This dataset contains country-level observations for the WHO GHO indicator "Domestic general government expenditure on PHC as % of primary health care expenditure (PHCE) (%)" (`GHED_PHC_GGHE-D_PHC_SHA2011`) across African nations, spanning 2016–2023. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区国内政府初级卫生保健支出占初级卫生保健总支出(PHCE)的百分比(GHED_PHC_GGHE-D_PHC_SHA2011)。数据覆盖2016至2023年间40个非洲国家,共计196条观测记录,均为国家-年份层面的聚合数值。原始数据通过Parquet格式重新打包,并采用统一的数据模式,其中核心数值提取自浮点精度的`NumericValue`字段,而非显示字符串。同时,在可用的情况下,数据集包含了置信区间上下界(`value_low`和`value_high`),以确保统计信息的完整性。
特点
该数据集具备多项显著特点。首先,其地域覆盖精准限定于WHO非洲区域(AFR),共纳入40个非洲国家,提供了聚焦于该区域卫生财政状况的细致快照。其次,数据的时间跨度为2016至2023年,能够满足近期趋势分析的需求。再者,数据集结构清晰,不包含子维度分层(每个国家-年份仅对应单一值),这一特性极大简化了模型训练与回归分析时的数据处理流程。最后,所有数值均经过科学归档,并附带置信区间,为不确定性量化提供了可靠依据,非常适合用于构建稳健的预测模型。
使用方法
使用该数据集时,推荐采用HuggingFace的`datasets`库进行加载,通过`load_dataset`函数即可快速获取并转换为pandas DataFrame,便于后续分析与建模。由于数据不包含子维度,可直接将`value_numeric`列作为回归或分类任务的目标变量。若需进行国家层面的长时间序列分析,可以通过`country_iso3`列进行过滤,并按`year`列排序。例如,筛选肯尼亚的数据即可获得其逐年PHCE支出占比的变化。此外,若要仅关注全国总体水平,可通过过滤`dim1`列以排除特定性别或居住地类型的子群体数据,确保模型输入的纯净性。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)编制,并由Electric Sheep Africa团队重新打包,旨在提供非洲国家2016至2023年间国内政府初级卫生保健(PHC)支出占初级卫生保健总支出(PHCE)百分比的关键指标。该数据集聚焦非洲区域(WHO AFRO),覆盖40个非洲国家共计196条观测记录,指标代码为GHED_PHC_GGHE-D_PHC_SHA2011。作为衡量各国政府对基础医疗服务财政投入力度的重要度量工具,该数据为评估非洲地区全民健康覆盖进展、追踪卫生筹资政策效果以及开展跨国家比较分析提供了标准化、机器可读的开放数据基础,对全球健康经济学研究和政策制定具有重要参考价值。
当前挑战
该数据集所解决的领域问题核心挑战在于:非洲国家普遍缺乏统一、口径一致且时间连续的PHC财政支出数据,传统来源常因定义差异、数据缺失或统计方法不透明而难以支撑可靠的跨国分析与机器学习建模。构建过程中面临的挑战包括:数据来源仅依赖WHO GHO单一API接口,更新频率受限于WHO的发布周期,导致2016-2023年间部分国家年份数据可能存在空白;指标本身为单一数值型,缺乏子维度分层,无法捕捉性别、城乡或年龄组间的支出差异,限制了多维度解析能力;且原始数据附带置信区间(value_low / value_high)并非对全部观测值均可用,增加了不确定性估计的复杂性。
常用场景
经典使用场景
该数据集的核心用途在于对非洲各国初级卫生保健(PHC)中政府国内一般支出占初级卫生保健总支出(PHCE)的比例进行纵向追踪与跨国家比较分析。鉴于非洲大陆卫生筹资体系的多样性与政策路径的差异化,这一指标为评估各国在初级卫生保健领域的财政投入强度与政策优先序提供了标准化度量工具。研究者可通过此数据集,清晰描绘2016至2023年间非洲各国政府PHC支出占比的演变趋势,从而为卫生经济学的跨时期面板数据建模、区域卫生绩效评估以及国际卫生发展目标的监测提供直接数据支撑。
解决学术问题
该数据集有效回应了非洲卫生体系研究中关于初级卫生保健财政优先级的量化测度难题。在学术层面,它使得研究者得以突破数据碎片化与口径不统一的桎梏,系统性地探究政府PHC支出占比与社会健康产出指标(如孕产妇死亡率、传染病发病率)之间的关联机理。通过对置信区间的整合分析,可更严谨地评估卫生筹资政策的稳健性。该数据集的存在推动了卫生经济学中关于公共财政资源配置效率的实证研究,尤其是为验证世界卫生组织倡导的全民健康覆盖(UHC)目标在非洲区域的落实进展提供了关键性数据基础。
衍生相关工作
围绕该数据集,已衍生出若干具有启发性的研究脉络。其中之一是将其纳入非洲卫生体系绩效的跨国比较分析框架,常与WHO全球卫生观察站(GHO)的其他指标(如每千人医生数、人均卫生支出)联合使用,构建多维度的卫生筹资效率评价模型。此外,该数据集也常作为时序分析与贝叶斯统计模型的输入,用以预测特定国家初级卫生保健支出的变化轨迹。在机器学习的应用方面,有工作将其与社会经济指标整合,训练回归模型以识别驱动政府PHC投入比例的关键因子,进而为卫生经济学中的政策模拟研究提供实证依据。
以上内容由遇见数据集搜集并总结生成



