five

electricsheepafrica/africa-who-domestic-general-government-health-expenditure-as-ggesha2011

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-domestic-general-government-health-expenditure-as-ggesha2011
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2023年间,世界卫生组织全球健康观察指标“政府卫生支出占政府总支出的百分比”(GHED_GGHE-DGGE_SHA2011)的国家级观测数据。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Domestic general government health expenditure (GGHE-D) as percentage of general government expenditure (GGE) (%)" (`GHED_GGHE-DGGE_SHA2011`) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在全球公共卫生治理的宏大叙事中,政府卫生支出是衡量一国健康福祉投入的关键标尺。该数据集以世界卫生组织全球卫生观察站的OData API为数据源头,聚焦非洲大陆47个主权国家,精心收录了2000年至2023年间“国内一般政府卫生支出占一般政府支出百分比”这一核心指标。原始数据经管道化清洗与标准化处理,摒弃显示字符串而采用浮点精度字段的数值,并保留了可用的置信区间上下界,最终封装为具有统一架构的Parquet文件,形成一套机器学习就绪的非洲健康数据资产。
特点
该数据集的独特之处在于其高度的结构化与域内完整性。共计1101条观测值覆盖了46个非洲国家长达24年的时序信息,字段设计兼具分析深度与可操作性:除作为主要机器学习目标变量的点估计值外,还包含数值的置信区间边界,为不确定性量化提供了坚实支撑。此外,数据集严格限制于WHO非洲区域,排除了非区域的干扰因素,且某一特定指标在国年层面上无细分维度,确保了数据的纯净与直接可比性,适合进行面板数据分析或回归建模。
使用方法
调用该数据集极为简便,依托HuggingFace Datasets库,仅需一行代码`load_dataset`即可完成加载并转换为Pandas数据帧,便于无缝接入主流数据科学生态系统。对于性别或居住地类型分层的研究,可通过过滤`dim1`字段中的特定后缀(如`_BTSX`代表两性)来获取全国层面的总体估计。此外,利用`country_iso3`与`year`字段可轻松提取任一国家的时序序列,为跨国比较或纵向趋势分析提供了高效的技术路径。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)旗下全球卫生观察站(GHO)创建,并由Electric Sheep Africa于2023年重新整理发布,专注于追踪2000至2023年间47个非洲国家的国内一般政府卫生支出(GGHE-D)占一般政府支出(GGE)的百分比。这一指标是衡量公共卫生投入力度与政府财政优先级的核心标尺,直接关联联合国可持续发展目标(SDG)中关于健康福祉与财政透明度的评估。通过整合WHO官方API数据并以标准化Parquet格式呈现,该数据集为机器学习驱动的非洲卫生财政分析提供了高质量基线,对区域政策制定者、全球卫生经济学家及跨境比较研究具有重要价值,成为连接数据科学与公共健康决策的关键桥梁。
当前挑战
该数据集面临的挑战具有双重维度。在领域问题层面,非洲各国卫生支出数据常因统计口径差异、财政年度错位及非正式经济占比高而存在可比性缺陷,仅凭GGHE-D/GGE单一指标难以完整反映实际健康投资效率或政府承诺的可持续性,需结合通胀、疾病负担及外部援助等混杂因素进行建模。在构建过程中,原始数据源经WHO多次修订历史回溯,不同年份间置信区间覆盖不一致(部分年份缺失值low/high字段),且部分国家存在年度跳跃性缺失,要求算法具备鲁棒的时间序列插补能力;同时,47国代码与行政区域变更(如国家合并或分裂)导致元数据对齐复杂,需仔细处理维度分化(如城乡、性别分层)以避免聚合偏差。
常用场景
经典使用场景
该数据集聚焦于非洲各国政府卫生支出占一般政府支出的比例,是评估公共卫生财政投入力度的核心指标之一。在流行病学与卫生经济学研究中,这一数据常被用于分析非洲国家卫生体系的可持续性与资源配置效率。研究者可借助该数据集构建面板数据模型,探索政府卫生支出与人口健康结局之间的关联,例如婴儿死亡率、预期寿命或传染病负担的变化趋势。此外,该数据集的跨年度与跨国别结构,使其成为研究非洲区域卫生政策变迁及国际卫生援助效果的理想素材。
解决学术问题
长期以来,非洲卫生经济研究面临数据碎片化与口径不统一的挑战。该数据集通过标准化处理47个非洲国家2000至2023年的政府卫生支出数据,有效解决了跨国比较中指标定义与统计方法不一致的难题。它为学者提供了可复现、可拓展的数据基础,支撑了关于卫生筹资公平性、政府支出效率以及卫生系统韧性的实证研究。这些研究对于揭示非洲国家在实现全民健康覆盖进程中的财政瓶颈、指导国际发展机构优化资源配置具有重要的学术与政策意义。
衍生相关工作
基于这一数据集,已衍生出多项关于非洲卫生筹资效率与健康产出关系的计量经济学研究。部分工作将政府卫生支出占比与疾病负担数据耦合,构建了卫生投入-产出弹性模型,揭示了卫生支出边际效益递减的阶段性特征。另有学者利用该数据评估了全球卫生倡议如全球基金、世界银行项目对非洲国家政府卫生支出挤入或挤出效应。此外,该数据集被整合进Electric Sheep Africa项目,成为构建非洲多模态健康数据平台的基础组件之一,支持了跨领域的数据融合与迁移学习探索。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务