electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-mppg190std
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-mppg190std
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标因家庭健康支出导致的贫困差距增加,以1.90美元/天的贫困线为基准的百分比(FINPROTECTION_IMP_PG_190_STD)在非洲国家的国家级观察数据,时间跨度为1985年至2019年。这是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。
This dataset contains country-level observations for the WHO GHO indicator Increase in poverty gap due to household health expenditures, expressed as a proportion of the $1.90 a-day poverty line (%) (FINPROTECTION_IMP_PG_190_STD) across African nations, spanning 1985–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集聚焦于非洲地区因家庭卫生支出导致的贫困缺口加剧程度,以1.90美元日均贫困线为基准进行百分比量化。数据源自世界卫生组织全球卫生观察站(WHO GHO)的OData API接口,经Electric Sheep Africa团队系统化整理与封装,以Parquet格式存储并统一模式架构。数据集涵盖了1985至2019年间41个非洲国家的观测值,共计307条记录,通过筛选WHO AFRO区域代码‘AFR’确保地域聚焦性。所有数值直接取自原始浮点精度字段NumericValue,而非显示字符串,同时包含了置信区间上下限(value_low与value_high)以增强统计严谨性。此外,数据集还按居住区域类型(农村、城市、总计)等维度进行了分层,每一层级的国家-年份-维度组合均独立成行,便于精细化分析。
特点
本数据集在结构与内容上展现出鲜明的特点。首先,其指标代码FINPROTECTION_IMP_PG_190_STD专门衡量家庭卫生支出对贫困缺口的增量影响,为评估健康保障的财务风险提供了关键视角。其次,数据覆盖了1985至2019年间的长期时间序列,涵盖41个非洲国家,为跨区域纵向比较奠定了坚实基础。数据集不仅包含点估计值,还提供了置信区间信息,使不确定性量化成为可能。同时,数据按照居住区域类型进行分层,用户可通过dim1与dim2字段灵活筛选特定亚群,如农村或城市人群。此外,统一的Parquet格式与规范化列名(如country_iso3、year、value_numeric)确保了机器学习任务的即用性与跨数据集的兼容性。
使用方法
该数据集的使用便捷高效,尤其适合机器学习与统计分析场景。用户可通过HuggingFace的datasets库直接加载,调用load_dataset函数获取完整的训练集,并可轻松转换为Pandas DataFrame进行后续处理。针对特定分析需求,例如仅研究两性合并的国家层面数据,可借助字符串筛选逻辑过滤dim1字段以剔除性别分层行。对于单一国家的时间序列分析,则可通过country_iso3列进行索引并依据年份排序,从而绘制趋势变化。数据集还支持按维度和年份进行聚合操作,适用于构建面板数据或进行回归建模。此外,所有观测值均附带置信区间,为稳健性检验与误差传播计算提供了必要条件。
背景与挑战
背景概述
该数据集由世界卫生组织全球卫生观察站(GHO)于2019年创建,并由Electric Sheep Africa团队重新整理发布,聚焦非洲地区因家庭卫生支出导致的贫困缺口增加占1.90美元/天贫困线比例(FINPROTECTION_IMP_PG_190_STD)。作为首个公开、机器学习就绪的非洲卫生经济数据集合,它覆盖1985至2019年间41个非洲国家的307条观测记录,旨在量化灾难性卫生支出对贫困深化的影响。该指标为评估全民健康覆盖(UHC)进展和卫生筹资公平性提供了关键基准,对非洲卫生政策制定、国际发展研究及数据驱动决策具有重要推动作用,尤其填补了区域级卫生经济风险建模的结构化数据空白。
当前挑战
该数据集所解决的领域挑战在于,非洲大量家庭因自付卫生支出陷入更深的贫困陷阱,而传统贫困测算常忽略健康冲击的动态效应;本数据以标准化指标(MPPG190STD)量化卫生支出对贫困缺口的增量贡献,使研究者能精准评估卫生筹资体系的保护能力。构建过程中面临两大挑战:一是跨年跨国数据一致性——WHO原始数据存在编码差异、缺失值和维度过细(如城乡分层)问题,需统一为规范模式;二是样本量有限(仅307行且涵盖1985–2019年的长时窗),使得时间序列分析与机器学习模型易受稀疏性影响,需谨慎处理置信区间与维度归并。
常用场景
经典使用场景
在全球化与健康公平研究领域,该数据集的核心用途在于量化家庭医疗支出对贫困缺口的冲击程度,尤其聚焦于非洲地区以1.90美元/天贫困线为基准的贫困深度变化。研究者通常利用其时间跨度(1985–2019)与分维度特征(如城乡、性别),构建面板数据模型来追踪医疗灾难性支出如何加剧贫困脆弱性,亦或通过回归分析揭示公共卫生政策对贫困缓冲效果的国别差异。
解决学术问题
该数据集系统性解决了健康经济学中医疗支出致贫效应的量化难题,特别是填补了非洲地区长期缺乏标准化、跨国家可比贫困缺口数据的空白。它使学者得以检验“因病致贫”假设在低收入环境下的普遍性,并评估世界银行与WHO倡导的全民健康覆盖(UHC)目标在减缓贫困冲击中的实际成效,从而为全球健康治理政策调整提供实证依据。
衍生相关工作
围绕该指标,学界衍生出两类经典工作:其一为基于时间序列的跨国贫困缺口预测模型,常结合气候、冲突等外生变量解释贫困波动的健康驱动因素;其二是利用置信区间上下限(value_low/value_high)开展不确定性分析,评估不同统计假设对贫困缺口估计的敏感度。这些工作多发表在《Health Policy and Planning》《Social Science & Medicine》等健康政策与贫困研究权威期刊。
以上内容由遇见数据集搜集并总结生成



