electricsheepafrica/africa-who-domestic-general-government-health-expenditure-as-chesha2011
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-domestic-general-government-health-expenditure-as-chesha2011
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“国内一般政府卫生支出(GGHE-D)占当前卫生支出(CHE)的百分比”(`GHED_GGHE-DCHE_SHA2011`)在非洲国家的国家级观察数据,时间跨度为2000年至2023年。它是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。
This dataset contains country-level observations for the WHO GHO indicator "Domestic general government health expenditure (GGHE-D) as percentage of current health expenditure (CHE) (%)" (`GHED_GGHE-DCHE_SHA2011`) across African nations, spanning 2000–2023. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,经Electric Sheep Africa项目整合与清洗后形成。它聚焦于非洲地区,收录了47个非洲国家在2000年至2023年间,用于衡量国内政府卫生支出占当期卫生支出百分比(即GHED_GGHE-DCHE_SHA2011指标)的观测数据。所有数据均以Parquet文件格式存储,确保了结构一致性与机器学习就绪性。数据值直接提取自API返回的浮点型字段NumericValue,而非显示字符串;对于具备置信区间的情况,数据集额外保留了上下界(value_low与value_high),从而提升了分析的可靠性。
特点
该数据集的核心特征在于其专注于非洲大陆的卫生经济指标,覆盖了长达24年的时间跨度与47个国家的完整面板数据,共计1101条记录。每个观测点均包含标准化字段,如国家代码(ISO 3166-1 alpha-3)、年份、WHO区域代码以及核心数值指标。特别值得一提的是,数据集在设计上保留了原生维度信息(dim1与dim2),并为每个观测提供了点估计值及其置信区间,为后续的机器学习建模(如回归或分类任务)提供了丰富的信号集合。此外,数据遵循CC BY 4.0许可协议,来源透明且持续更新。
使用方法
使用该数据集时,推荐通过HuggingFace的datasets库直接加载,例如调用load_dataset('electricsheepafrica/africa-who-domestic-general-government-health-expenditure-as-chesha2011')即可获得训练集。加载后,可将数据转为pandas DataFrame以进行深入分析。若需提取全国层面且不分性别的数据,需过滤dim1字段为空或末尾为'_BTSX'的条目。对于时间序列分析,可对特定国家代码(如KEN)按年份排序即可。该数据集天然适用于卫生经济学领域的交叉验证、趋势预测以及国家间比较建模任务。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队整理,源自世界卫生组织(WHO)全球卫生观察站(GHO)的开放数据API,收录了2000至2023年间47个非洲国家的国内政府卫生支出(GGHE-D)占当期卫生支出(CHE)的百分比指标。数据集涵盖了1101条观测记录,并提供了置信区间等辅助信息,旨在为非洲卫生经济政策的量化研究提供标准化、机器学习友好的数据基础。作为非洲健康数据统一化存储库的一部分,该数据集填补了该地区卫生支出领域精细、结构化时序数据的空白,为探讨政府卫生投入对区域公共卫生体系的影响奠定了数据支撑,并推动了相关领域的实证研究与国际比较。
当前挑战
该数据集所解决的领域问题主要包括两个方面:一是非洲大陆卫生支出数据的分散性与不一致性,缺乏统一、可比的指标定义和统计口径;二是现有数据多为整数值或文本格式,难以直接用于机器学习模型的训练与评估。在构建过程中,团队面临诸多挑战:数据需从WHO OData API实时抽取,但原始API返回的字段存在数值与展示字符串并存的情况,需统一提取浮点数精度字段(NumericValue)并丢弃冗余显示字符串;不同国家的数据覆盖率差异显著,部分年份或国家存在缺失值,需在保持时间序列完整性的同时处理置信区间边界值。此外,数据集的标准化需兼顾国际分类标准(如SHA 2011)与本地化需求,确保维度字段(如dim1、dim2)的语义一致性,以支持多维度聚合与筛选操作。
常用场景
经典使用场景
该数据集聚焦于非洲各国政府国内一般卫生支出(GGHE-D)占当期卫生支出(CHE)的百分比,数据涵盖2000至2023年间47个非洲国家的逐年观测值。作为世界卫生组织全球卫生观察站(WHO GHO)的核心指标之一,它在公共健康与卫生经济研究中被广泛用于评估各国政府对卫生系统的财政承诺力度。研究人员常通过此数据集分析卫生支出的时间序列变化、国家间差异及其与健康结果之间的关联,是理解非洲地区卫生融资结构演变不可或缺的基础资源。
实际应用
在实际应用中,该数据集被国际组织、国家卫生部门及非政府机构用于监测和评估卫生筹资体系的可持续性与效率。例如,世界卫生组织在年度全球卫生支出报告中引用此类数据,跟踪非洲各国在阿布贾宣言中承诺的卫生支出目标达成情况。政策制定者亦借助该指标识别卫生财政缺口,优化预算分配,推动健康保险制度改革。对于关注非洲发展的金融机构和慈善基金会,它也是评估援助影响与投资回报率的重要参考依据。
衍生相关工作
该数据集衍生出多项具有影响力的研究工作,包括基于时间序列的非洲卫生支出收敛性分析、政府支出与妇幼健康指标之间的面板数据因果推断,以及利用机器学习方法预测未来卫生支出趋势的建模研究。此外,一些学者将其与联合国开发计划署的人类发展指数、世界银行的国家收入分类数据结合,构建了跨领域卫生融资效率评估框架。该数据集还被纳入Electric Sheep Africa项目,成为推动非洲数据科学社区发展、降低数据分析门槛的典型案例。
以上内容由遇见数据集搜集并总结生成



