five

electricsheepafrica/africa-who-external-health-expenditure-as-percentage-of-current-health

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-external-health-expenditure-as-percentage-of-current-health
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“外部健康支出(EXT)占当前健康支出(CHE)的百分比”(GHED_EXTCHE_SHA2011)在非洲国家的国家级观察数据,时间跨度为2000年至2023年。它是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "External health expenditure (EXT) as percentage of current health expenditure (CHE) (%)" (`GHED_EXTCHE_SHA2011`) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源于世界卫生组织全球卫生观测站的官方OData API,聚焦于非洲地区国家层面外部卫生支出占经常性卫生支出百分比的时序监测指标(GHED_EXTCHE_SHA2011)。数据经过系统性重组织,以Parquet文件格式统一封装,确保机器学习就绪的标准化架构。所有数值均提取自原始字段中的高精度浮点型数据,并附带了置信区间上下界(若可用),从而保障了统计严谨性与分析可靠性。数据覆盖2000至2023年间47个非洲国家,共计1101条观测记录,严格遵循WHO非洲区域(AFR)的筛选条件。
特点
该数据集具备多重鲜明特色:其一,采用一致且简洁的列式结构,包含国家ISO代码、WHO区域标识、年份与核心指标数值,同时呈现置信区间与格式化显示字符串,便于科学计算与可视化呈现。其二,预留维度字段(dim1/dim2)以支持按性别、居住地类型等亚组进行精细化过滤,尽管本指标为单一值无分层,但仍保留框架兼容性。其三,时间跨度为2000至2023年、覆盖47个非洲国家,使其成为研究非洲卫生融资趋势、跨国对比与政策评估的珍贵纵向资源。
使用方法
用户可通过HuggingFace Datasets库直接加载数据集,调用load_dataset函数即可获取预处理的Parquet文件,并可用to_pandas方法转换为DataFrame进行灵活操作。基于字段特性,推荐先过滤出性别为“两者”或维度为空的全国层面数据以获得无偏估计,再按需对国家列(country_iso3)进行筛选并依年份排序,从而构建时间序列分析。数据亦可直接用于表格分类或回归任务,作为机器学习模型中的特征或目标变量,适配多样化的定量研究需求。
背景与挑战
背景概述
在非洲公共卫生治理的复杂图景中,外部卫生支出占经常性卫生支出的比重(EXT/CHE)是衡量区域卫生融资可持续性与依赖度的核心指标。该数据集由Electric Sheep Africa团队于世界卫生组织全球卫生观察站(GHO)2023年发布数据的基础上整理构建,覆盖2000至2023年间47个非洲国家的年度观测值。研究聚焦于量化非洲国家卫生系统对外部资金(如国际援助、捐赠)的依赖程度,并借助统一、机器学习友好的结构化格式——包含点估计与置信区间——为卫生经济建模、政策模拟及跨国比较研究提供坚实基础。作为非洲数据整合的重要成果,该数据集显著提升了WHO官方数据在计算社会科学与数据科学领域的可访问性与可复用性,推动了针对非洲卫生融资脆弱性的实证分析。
当前挑战
该数据集在应用层面首先直面非洲卫生融资领域长期存在的数据稀疏性与质量异质性难题:许多欠发达国家的医疗支出记录不完整,甚至存在多年缺失值,这给时间序列分析与预测模型带来了系统性偏差风险。其次,外部卫生支出的界定与统计口径在不同国家及年份间可能存在细微差异,数据整合时需谨慎处理WHO原始API中元数据的兼容性问题。在构建过程中,团队面临的核心挑战包括从庞杂的GHO指标体系中精准提取并校验特定代码(GHED_EXTCHE_SHA2011)的数值型字段,同时保留置信区间以支持不确定性量化。此外,如何设计统一的Parquet架构以容纳未来可能增加的子维度分层(如性别、城乡)并确保跨国家、跨时间的可扩展性,对数据工程提出了高标准的规范化要求。
常用场景
经典使用场景
非洲国家在卫生筹资方面长期面临外部援助依赖度高、内部资源分配不均等严峻挑战,该数据集为追踪外部卫生支出占经常性卫生支出比例这一关键指标提供了系统化的时间序列数据。经典使用场景涵盖跨国比较分析、时间趋势建模以及卫生政策影响评估,研究者可基于2000至2023年间47个非洲国家的国家级观测值,运用回归分析、面板数据模型或机器学习算法,揭示外部卫生资金的流向规律及其与卫生系统绩效之间的动态关联。
衍生相关工作
基于该数据集,衍生出若干在非洲卫生经济领域具有标杆意义的经典工作。例如,利用该指标与国内卫生支出及人均卫生费用进行联合建模,诞生了评估援助依赖性与卫生系统韧性的面板协整分析框架。此外,结合世界银行及联合国开发计划署的治理指标,衍生出一系列探讨外部卫生资金、政府效能与健康产出之间中介效应的结构方程模型研究,为理解复杂卫生筹资生态系统提供了方法论范例。
数据集最近研究
最新研究方向
在全球卫生治理的宏大叙事中,非洲大陆外部卫生支出占经常性卫生支出比重的研究正成为国际发展经济学与公共卫生交叉领域的前沿焦点。基于世界卫生组织全球卫生观察站(WHO GHO)的标准化指标GHED_EXTCHE_SHA2011,该数据集覆盖47个非洲国家2000至2023年的纵向观测,为量化外部卫生援助依赖度、评估卫生筹资可持续性提供了精细化数据支撑。当前热点方向包括:利用高时间分辨率面板数据构建脆弱性预警模型,以揭示卫生系统对外部资金中断的弹性阈值;结合机器学习回归范式识别外部支出分布不均的结构性动因,如治理指数与卫生优先级的交互效应;以及通过置信区间跨层推断,剖析新冠疫情后外部卫生资金激增对健康结果的长期补偿效应。这些探索不仅深化了援助有效性辩论的实证基础,更助力非洲各国制定去依赖化的卫生财政转型路径,在2030年可持续发展目标框架下具有深远的政策转化价值。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务