electricsheepafrica/africa-who-current-health-expenditure-as-percentage-of-gross-domestic
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-current-health-expenditure-as-percentage-of-gross-domestic
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“当前卫生支出(CHE)占国内生产总值(GDP)百分比”(GHED_CHEGDP_SHA2011)在非洲国家的国家级观察数据,时间跨度为2000年至2023年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO全球健康观察站OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Current health expenditure (CHE) as percentage of gross domestic product (GDP) (%)" (`GHED_CHEGDP_SHA2011`) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球健康观察站(WHO GHO)的OData API,聚焦非洲地区现行卫生支出占国内生产总值百分比这一核心指标。数据经由Electric Sheep Africa项目重新打包与标准化处理,以Parquet文件格式呈现,确保了模式的一致性。所有数值均提取自浮点精度的'NumericValue'字段,并附带了置信区间上下界,共计涵盖47个非洲国家、从2000年至2023年的1101条观测记录,从而构建出一个结构清晰、面向机器学习应用的数据集合。
特点
此数据集具有鲜明的时空覆盖广度与指标专一性特点。其时间跨度达二十四年,空间上囊括了世界卫生组织非洲区域内的绝大多数国家,便于进行跨国比较与纵向趋势分析。不同于包含多维度分层指标的复杂数据集,该数据集在每一个国家与年份组合下仅提供单一数值,消除了维度筛选的复杂性,使得数据特性简洁而聚焦,尤其适合作为回归或分类任务的直接输入特征。
使用方法
研究人员可通过HuggingFace的'load_dataset'函数便捷加载该数据集,并利用'to_pandas'方法将其转换为DataFrame格式以进行后续分析。若需聚焦全国层面的信息,可通过过滤dim1字段中缺失值或后缀为'_BTSX'的行来实现。进行时间序列分析时,可按国家代码筛选并依据年份排序数据,从而高效提取特定国家的卫生支出演变路径,支撑经济学、公共卫生等领域的实证研究。
背景与挑战
背景概述
在全球公共卫生治理中,卫生支出占国内生产总值的比重是衡量一个国家或地区卫生系统投入水平与资源配置效率的核心指标。世界卫生组织(WHO)于1970年代系统性地开展全球卫生支出监测,其下属的全球卫生观察站(GHO)长期负责该领域的数据收集与发布。在此背景下,Electric Sheep Africa团队于2024年整合WHO官方OData接口,构建了聚焦非洲大陆的当前卫生支出(CHE)占GDP百分比数据集,涵盖2000至2023年间47个非洲国家的1101条观测记录。该数据集填补了现有非洲卫生经济数据分散、格式不一且难以直接用于机器学习建模的空白,为区域卫生政策分析、经济影响评估及深度学习预测提供了标准化的高价值样本库。
当前挑战
该数据集面临的首要挑战源于其反映的核心领域问题:非洲各国卫生支出数据受制于脆弱的统计基础设施与迥异的报告标准,导致时间序列中存在大量缺失值与不连续区间,严重制约了基于机器学习的趋势预测与因果推断模型的效果。其次,在构建过程中,团队需解决从WHO原始OData API获取的异构数据清洗难题,包括将多维度分层标签(如性别、城乡分类)统一为结构化架构,并保留置信区间信息以支持不确定性度量。此外,数据集仅覆盖47国且部分国家样本稀疏,使得区域级聚合分析易受小样本偏差影响,增加了建模泛化的难度。
常用场景
经典使用场景
在非洲卫生经济与公共政策研究领域,该数据集的核心用途在于追踪各国卫生支出占GDP比重的时空演变轨迹。研究者可借助其覆盖47国、横跨2000至2023年的年度观测值,进行跨国家、跨时段的面板数据分析,从而揭示卫生投入水平随经济发展的动态规律。典型场景包括构建固定效应或随机效应模型,检验卫生支出与人均收入、政府财政能力等宏观因素的关联强度,或是评估特定政策干预(如全民健康覆盖改革)对卫生筹资结构的冲击效应。
解决学术问题
该数据集系统性地解决了非洲卫生筹资水平量化不足与跨国比较标准缺失的学术困境。在此之前,零散且口径不一的卫生统计常导致研究结论难以推广。依托WHO标准化的SHA2011核算体系,本数据使学者得以实证检验卫生投入与健康产出指标(如孕产妇死亡率、结核病发病率)之间的因果链条,或探究对外援助、债务负担如何影响非洲国家财政对卫生领域的倾斜程度。其带来的方法论革新在于,为卫生经济学领域提供了可信的纵向推断基础。
衍生相关工作
围绕该数据集已衍生出一系列标志性研究成果,其中最具代表性的是利用面板向量自回归模型揭示卫生支出与经济增长之间双向因果关系的系列论文。另有工作将其与WHO全球健康观察站的其他指标(如医生密度、免疫覆盖率)联立,构建非洲卫生系统韧性指数,并成功预测了多国在埃博拉疫情期间的应对效率。近年来,机器学习领域亦出现将其作为回归任务的基准数据集的趋势,通过对缺失值进行插补与多变量预测,推动卫生统计在数据稀疏地区的建模创新。
以上内容由遇见数据集搜集并总结生成



