five

electricsheepafrica/africa-who-out-of-pocket-expenditure-per-capita-in-us

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-out-of-pocket-expenditure-per-capita-in-us
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了世界卫生组织全球健康观察站(WHO GHO)指标人均自付医疗支出(以美元计)(`GHED_OOP_pc_US_SHA2011`)在非洲国家的国家层面观测数据,时间跨度为2000年至2023年。数据集是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO全球健康观察站OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`, `value_high`)。

This dataset contains country-level observations for the WHO GHO indicator Out-of-pocket expenditure (OOP) per capita in US$ (`GHED_OOP_pc_US_SHA2011`) across African nations, spanning 2000–2023. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集来源于世界卫生组织全球卫生观察站(WHO GHO)的OData API,专注于非洲地区人均自付医疗支出(以美元计)这一关键健康指标。数据以Parquet文件格式重新打包,确保一致的架构设计,并直接从API获取浮点精度的数值字段,而非显示字符串,同时包含置信区间下界与上界。数据覆盖2000年至2023年间47个非洲国家,共计1101条记录,按国家ISO3代码、年份等字段组织,形成整洁的表格化结构。
特点
该数据集的核心特点在于其专注性与统一性——专门针对非洲区域,所有观测值均来自WHO AFRO区域,具有高度地域指向性。指标无子维度,每个国家与年份组合对应单一数值,简化了分析复杂度。此外,数据集提供了完整的元数据字段,包括指标代码、置信区间及最新更新时间,便于用户直接用于机器学习的回归或分类任务,同时支持多层级筛选,如按性别或居住区域类型进行进一步细分。
使用方法
通过HuggingFace的datasets库即可便捷加载该数据集,使用load_dataset函数可直接获取训练集,并转换至Pandas DataFrame进行深入分析。用户可依据dim1字段(如SEX_BTSX)筛选全国两层数据,或按国家ISO3代码(如KEN)提取具体国家的时序数据,以研究人均自付医疗支出的变化趋势。该数据集即开即用,适配于机器学习模型的训练与评估场景,尤其适合非洲卫生经济领域的量化研究。
背景与挑战
背景概述
在全球卫生治理与健康经济交叉领域,个人自付医疗支出(Out-of-pocket expenditure, OOP)是衡量家庭医疗经济负担及卫生系统筹资公平性的核心指标。世界卫生组织(WHO)全球卫生观察站(GHO)自2000年起系统追踪各国OOP数据,非洲地区因其脆弱的公共卫生体系与高比例的灾难性卫生支出尤为值得关注。该数据集由Electric Sheep Africa团队于2023年整理发布,聚焦47个非洲国家2000至2023年的OOP人均支出(美元),原始数据源自WHO官方API并标准化为机器学习就绪的Parquet格式。这一精细化、长时序的数据资源,为揭示非洲卫生筹资动态、评估全民健康覆盖进展提供了稀缺的量化基础,尤其填补了亚非拉区域健康经济数据散乱、难以直接用于计算建模的空白。
当前挑战
该数据集所解决的领域核心挑战在于:非洲卫生经济监测长期受限于数据碎片化、指标定义不统一及年份不连续,导致宏观度量与预测模型难以建立。具体而言,数据集构建面临多源异构数据整合的难题,如各国上报口径差异(SHA2011核算框架与先前版本的不兼容)、缺失值处理(置信区间仅在部分年份提供)以及时间序列中断(部分国家早期观测缺失)。此外,数据仅反映总量均值,未能刻画城乡、性别间不平等分布,且单一指标无法揭示OOP背后的疾病类别或服务类型,限制了其对政策干预的因果推断能力。机器学习使用时,还需警惕异常值(例如战乱或经济危机年份的极端值)对回归模型的扰动。
常用场景
经典使用场景
在非洲卫生经济与政策研究领域,该数据集为分析各国居民自付医疗支出的长期趋势提供了基础性资源。研究者常将其作为核心变量,用于考察2000至2023年间47个非洲国家的人均自付医疗支出的时空演变规律,并结合国家层面的宏观经济指标或公共卫生投入数据,构建面板回归模型。其经典应用聚焦于探索卫生筹资公平性与医疗费用可负担性之间的关系,例如评估支出水平对贫困发生率的潜在驱动作用,或揭示不同卫生体系框架下家庭经济风险保护效果的差异。数据集的纵向覆盖特征与一致性架构使其成为追踪医疗支出动态变化、识别脆弱国家群体的关键工具。
实际应用
在实际应用层面,该数据集广泛服务于国际发展组织与非洲各国卫生部的政策评估与规划工作。世界卫生组织和世界银行的分析师可借助其数据资源,识别自付医疗支出异常高企的国家与时间节点,针对性设计卫生筹资改革方案。例如在制定国家健康保险扩展策略时,通过分析支出变化趋势,优先补贴最易受医疗费用冲击的脆弱群体。区域经济共同体如非盟亦利用该数据监测《非洲卫生战略》中降低家庭医疗经济风险目标的达成情况。此外,非政府组织在计算疾病负担、开展卫生项目成本效益分析时,常以此数据集作为基线,评估干预措施对减轻患者直接医疗费用的实际效果。
衍生相关工作
该数据集为一系列衍生研究工作奠定了数据基石。在方法论层面,催生了结合置信区间信息的贝叶斯层次时空模型,用以更精确地插补非洲国家间自付医疗支出的缺失值,克服了原始数据稀疏性带来的估计偏差。在应用层面,衍生研究构建了涵盖支出、疾病谱与卫生系统特征的综合性脆弱性指数,并发掘了支出水平与心血管疾病、疟疾等特定病种患病率之间的非线性耦合关系。部分学者还将其与WHO国家卫生账户数据联动,开发了预测医疗费用灾难性支出发生概率的机器学习模型。这些工作不仅拓展了原始数据集的学术价值,也为非洲卫生筹资领域的后续实证分析提供了可参照的范式与基准。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务