electricsheepafrica/africa-who-domestic-general-government-health-expenditure-as-gdpsha2011
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-domestic-general-government-health-expenditure-as-gdpsha2011
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标国内一般政府卫生支出(GGHE-D)占国内生产总值(GDP)百分比在非洲国家的国家层面观察数据,时间跨度为2000年至2023年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖47个非洲国家,共计1,101行数据。
This dataset contains country-level observations for the WHO GHO indicator Domestic general government health expenditure (GGHE-D) as percentage of gross domestic product (GDP) (%) (GHED_GGHE-DGDP_SHA2011) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 1,101 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区国内一般政府卫生支出(GGHE-D)占国内生产总值(GDP)的百分比这一关键指标。数据覆盖2000年至2023年间47个非洲国家的1101条观测值,经系统化清洗与整合后,以Parquet格式存储,并采用统一的字段架构。所有数值均采自原始数据中的浮点精度字段`NumericValue`,而非格式化显示字符串,同时保留置信区间上、下限(`value_low`、`value_high`)以增强统计严谨性。作为Electric Sheep Africa项目的一部分,该数据集旨在为机器学习提供整洁、直接可用的非洲健康数据资源。
特点
本数据集的核心特色在于其高度的专业性与结构化。指标代码`GHED_GGHE-DGDP_SHA2011`确保了与WHO官方定义的精准对应,且每个国家-年份组合仅对应单一数值,无额外子维度分层,简化了建模复杂度。数据列设计清晰,包含`indicator_code`、`country_iso3`、`year`、`value_numeric`等关键字段,并额外提供`value_low`与`value_high`以支撑置信区间分析。经过区域过滤(`ParentLocationCode = 'AFR'`),全部数据严格限定于WHO非洲区域,赋予其地理焦点。此外,原始WHO数据的CC BY 4.0许可协议保障了开放共享的合法性。
使用方法
用户可通过HuggingFace的`datasets`库轻松加载该数据集,一键命令`load_dataset("electricsheepafrica/africa-who-domestic-general-government-health-expenditure-as-gdpsha2011")`即可获取训练集。加载后数据可直接转换为Pandas DataFrame展开分析。对于回归或分类任务,建议按需求过滤:如筛选全国整体水平,可利用`dim1`列排除分层数据(如选择以_BTSX结尾或空值);针对特定国家的时间序列分析,则可通过`country_iso3`列(如`KEN`代表肯尼亚)结合`year`列升序排列后实现。代码示例清晰展示了这些典型操作路径。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)创建,并由Electric Sheep Africa团队重新打包,聚焦于非洲47个国家在2000至2023年间国内一般政府卫生支出(GGHE-D)占国内生产总值(GDP)的百分比。核心研究问题在于量化非洲各国政府卫生投入的经济负担与政策倾向,为跨区域比较、健康经济建模及可持续发展目标(SDG)监测提供关键指标。作为机器学习就绪的数据库,它填补了非洲健康经济领域结构化、标准化数据的空白,对全球卫生政策分析、资源分配模拟及新冠疫情后卫生系统韧性评估具有重要影响力。
当前挑战
数据集所解决的领域问题包括:非洲各国卫生支出数据长期存在缺失、统计口径不一及时间序列不完整,导致难以进行精准的区域健康经济分析;此外,不同国家间GDP核算方法差异及通货膨胀调整(SHA2011标准)增加了跨年代比较的复杂性。构建过程中,挑战集中于整合WHO OData API中多源异构数据,统一转换至Parquet格式并保留置信区间字段(value_low/value_high),同时需处理指示符描述与数值字段的歧义,确保机器学习模型可直接以浮点型点估计值作为目标变量,而忽略格式化字符串(value_display)的干扰。
常用场景
经典使用场景
该数据集记录了2000至2023年间47个非洲国家的国内一般政府卫生支出占国内生产总值(GDP)的百分比,是评估非洲区域政府卫生投入力度的关键指标。其经典使用场景集中于时间序列分析与跨国比较研究,通过揭示各国卫生支出随经济发展、政策调整或重大公共卫生事件(如疫情)的动态演变轨迹,为宏观卫生经济建模提供标准化数据基础。研究者可利用其一致的数值字段与置信区间,构建面板数据回归模型,探究卫生支出与人口健康结果、经济增长之间的关联,或作为联合国可持续发展目标(SDG)中健康相关指标的监测工具。
实际应用
在实际政策与公共卫生实践中,该数据集被广泛用于国家卫生账户核算、预算监测及国际援助效果评估。世界卫生组织(WHO)及各区域办事处可据此追踪各国政府对卫生领域的财政承诺履行情况,识别筹资缺口与资源分配不均的热点区域。非洲各国卫生部与财政部门能在此基础上,制定基于证据的卫生预算编制策略,优化有限公共资源的配置效率。此外,非政府组织与国际发展机构(如世界银行、全球基金)常利用此数据作为资助决策与项目效果评估的基准,尤其是在健康结果挂钩的绩效拨款机制中发挥关键作用。
衍生相关工作
该数据集衍生出多项具有影响力的学术与政策分析工作。一些研究将其与医疗服务覆盖率、疾病负担等指标融合,构建了卫生筹资系统可持续性评估框架;另一些工作则聚焦于财政分权与卫生支出效率的关系,利用面板数据模型识别出制度因素对政府卫生投入的调节效应。此外,基于该数据集的机器学习预测模型被用于预警国家卫生支出偏离趋势的场景,例如在COVID-19大流行期间,相关衍生物成功模拟了疫情对非洲各国卫生预算冲击的幅度与恢复路径,为各国制定应急卫生财政响应计划提供了量化依据。
以上内容由遇见数据集搜集并总结生成



