electricsheepafrica/africa-who-current-health-expenditure-per-capita-in-us
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-current-health-expenditure-per-capita-in-us
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“当前人均健康支出(美元)”在非洲国家的国别观察数据,时间跨度为2000年至2023年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据仓库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Current health expenditure (CHE) per capita in US$" (`GHED_CHE_pc_US_SHA2011`) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家在2000年至2023年间的人均当前卫生支出(CHE,以美元计)。数据获取后经过系统化重构,采用Parquet格式存储,并统一了各字段的Schema结构。核心数值来源于NumericValue字段以确保精度,同时保留了置信区间上下限等辅助信息。数据集仅包含单一指标,未进行性别或年龄等分层处理,因此每个国家与年份的组合对应一行记录,总共涵盖47个非洲国家的1101条观测数据。
使用方法
通过Hugging Face的datasets库即可便捷加载该数据集,使用load_dataset函数直接获取训练集并转换为Pandas DataFrame进行分析。用户可依据dim1字段的SEX_BTSX后缀或缺失值筛选出全国层面的数据,从而聚焦于总体卫生支出趋势。对于时序研究,可按照国家ISO代码进行分组,并通过年份排序构建连续的时间序列。由于数据集格式统一、字段定义清晰,研究人员可以迅速将其融入现有的数据管道中,无需进行繁琐的预处理工作。
背景与挑战
背景概述
在全球健康治理与可持续发展目标的推进过程中,卫生支出数据是评估卫生系统绩效、指导资源分配以及监测健康成果的核心变量。世界卫生组织(WHO)全球卫生观察站(GHO)长期致力于提供可比较的跨国卫生经济指标,其中“当前人均卫生支出(以美元计)”是衡量各国卫生投入强度的关键标尺。该数据集由Electric Sheep Africa于2023年从WHO GHO的OData API系统收集并重新打包,覆盖2000至2023年间47个非洲国家的1101条观测值,旨在为机器学习研究提供统一、清晰且可重复利用的非洲卫生数据基础。通过将该指标从官方表格转化为结构化Parquet格式,数据集降低了跨学科使用卫生经济数据的门槛,推动了非洲区域卫生系统建模、预测与不平等分析等研究议程的发展。该数据集整合了置信区间字段,保留了原始统计精度,为科学计算与政策模拟提供了可信赖的数值支撑。
当前挑战
该数据集所应对的领域核心挑战在于非洲卫生支出数据的稀疏性与可比性缺失:许多国家的历史记录不完整,导致时间序列建模面临严重的缺失值问题;此外,不同年份间统计口径与货币换算的差异使得跨国比较变得复杂。在构建过程中,团队面临的主要困难包括:从WHO API中提取的原始数据常含有冗余显示字符串与不一致的分类编码,需进行严格的字段清洗与类型转换;同时,部分指标存在按性别、居住地区等维度分层,自动区分“全国总量”与“分层子集”并筛选出统一样本需要精准的过滤逻辑。为确保数据质量,还需处理置信区间字段的缺失情况,并在不引入人为偏倚的前提下保留可用记录。这些挑战要求数据集在简单可用性与统计严谨性之间取得平衡。
常用场景
经典使用场景
在公共卫生与全球健康治理领域,该数据集最经典的使用场景是开展非洲各国卫生支出的跨国比较与长期趋势分析。研究者可以依据2000至2023年间47个非洲国家的人均当前卫生支出(CHE)数据,追踪各国在卫生系统资金投入上的动态演变。借助数值型观测值及置信区间信息,可用于评估不同国家卫生筹资的稳定性与变迁模式,为理解非洲大陆卫生支出的区域差异、时空格局及其与经济发展水平的关系,提供了坚实的数据基础。
解决学术问题
该数据集系统性地解决了非洲地区卫生经济研究领域长期存在的数据碎片化、口径不统一及时间跨度短等关键瓶颈问题。它使得学术界能够围绕卫生支出与国家健康产出间的关联机制展开严谨的计量分析,探索卫生经费投入对人口健康指标的边际效应;同时,为检验卫生筹资公平性、评估全民健康覆盖进程中的资金缺口等理论命题,提供了高质量的实证素材。其标准化的数据架构与长期覆盖性,显著推动了非洲卫生经济学的交叉研究进程。
实际应用
在实际决策层面,该数据集为国际发展机构、各国卫生部及非政府组织提供了关键的循证基础。政策制定者可据此评估本国卫生投入是否紧跟人口健康需求,并与其他非洲国家进行对标比较,从而优化预算分配策略。世界卫生组织及非洲疾病预防控制中心亦可利用该数据监测区域卫生筹资目标的实现进度,识别资金投入薄弱的环节。此外,通过绘制卫生支出的时空分布图谱,可辅助后疫情时代卫生系统韧性建设的投资决策。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家2000至2023年间人均当前卫生支出的时序变化,为机器学习驱动的卫生经济学预测与政策评估提供了关键基石。随着全球健康安全议程在非洲大陆的深化,尤其是后疫情时代对卫生系统韧性的迫切关注,研究者正利用这一高维面板数据构建稳健的回归模型,以解析卫生支出与疾病负担、医疗可及性之间的非线性关联。结合世界卫生组织的官方口径与标准化数据架构,该数据集有力支持了非洲卫生融资模式的跨国际比较与可持续发展目标的量化追踪,成为评估区域卫生治理效能及预警公共卫生风险的重要数据桥梁。
以上内容由遇见数据集搜集并总结生成



