electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-mppg310std
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-mppg310std
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含WHO GHO指标“因家庭医疗支出导致的贫困差距增加,以3.20美元/天的贫困线为比例(%,全国、农村、城市)”在非洲国家的国家级观测数据,时间跨度为1985年至2019年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适用于机器学习的非洲数据存储库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Increase in poverty gap due to household health expenditures, expressed as a proportion of the $3.20 a-day poverty line (%, national, rural, urban)" (`FINPROTECTION_IMP_PG_310_STD`) across African nations, spanning 1985–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区因家庭卫生支出导致的贫困缺口加剧情况,以每日3.20美元贫困线为基准进行比例测算。数据经过精密提取与重构,仅保留浮点精度的NumericValue字段作为核心取值,并纳入置信区间边界值(value_low、value_high)以增强统计严谨性。来自41个非洲国家的310条观测记录涵盖1985至2019年间的时间跨度,并依据居住地类型(农村、城市、全国)进行分层,使得每一行代表特定国家、年份与维度的唯一组合。最终以Parquet格式封装,统一架构后纳入Electric Sheep Africa集合,成为可直接用于机器学习的数据资源。
特点
该数据集具备鲜明的多维性与层级结构,以指示符代码FINPROTECTION_IMP_PG_310_STD为核心标识,通过residenceareatype维度将指标细分为全国、农村与城市三个层面,便于研究者聚焦不同地理单元的卫生经济负担。数据列设计兼顾统计精度与可解释性,包含点估计值、上下置信区间及格式化显示字符串,支持置信推断与可视化表达。此外,数据集记录来源清晰,附有WHO数据更新时戳,确保时序分析的可追溯性。仅310行的小规模特性使其适合作为非洲卫生政策与贫困交叉领域的探索性数据分析或回归建模的起点。
使用方法
通过HuggingFace datasets库可一键加载该数据集,调用load_dataset函数即可获得包含所有字段的train分割,并迅速转换为pandas DataFrame以进行下游处理。研究者可利用dim1列中的RESIDENCEAREATYPE值进行分层过滤,例如仅保留全国层面或特定居住地类型的数据用于宏观趋势分析。针对国别时间序列研究,可通过country_iso3字段筛选单一国家并按年份排序,从而刻画贫困缺口随时间的演变轨迹。若需跨层聚合,可基于dim1/dim2字段完成维度合并以适应不同分析粒度,模型训练时可直接将value_numeric作为回归目标变量。
背景与挑战
背景概述
在撒哈拉以南非洲地区,家庭医疗支出已成为导致贫困深化的关键因素之一。世界卫生组织全球卫生观察站于2019年发布的这一数据集,系统记录了1985年至2019年间41个非洲国家因家庭卫生支出导致的贫困缺口增加情况,指标以每日3.20美元贫困线为基准进行测算。由Electric Sheep Africa团队整理并重新打包的数据集,纳入了国家、农村与城市三个维度的分层观测值,共计310条记录。该数据集为量化医疗支出对贫困影响的区域差异提供了标准化、机器学习友好的基础数据,推动了卫生经济与公共政策交叉领域的研究发展。
当前挑战
该数据集所应对的核心领域问题在于,如何精准量化医疗支出对贫困的加剧效应,尤其是区分不同居住地类型(农村与城市)之间的异质性影响。传统宏观贫困指标常忽略家庭健康支出的致贫机制,而该指标通过贫困缺口比例的变化揭示了卫生系统财务风险保护的薄弱环节。在构建过程中,数据整合面临多重挑战:来自WHO OData API的原始数据存在维度分层复杂、缺失置信区间、以及国家年份观测值稀疏等问题。此外,将文本型显示值转换为浮点数值时需处理格式歧义,确保跨时间、跨国别的数据可比性与一致性,这些皆为提升数据集可用性所必须克服的技术障碍。
常用场景
经典使用场景
在健康经济学与全球卫生政策研究领域,该数据集常被用于量化分析家庭医疗支出对贫困加深程度的影响。研究者可基于其提供的国家、年份与城乡分层维度,构建面板数据模型,考察医疗自付费用在不同收入群体间的不平等分布,进而评估各国健康保障体系的脆弱性。借助其以每日3.20美元贫困线为基准的标准化贫困缺口指标,可追踪非洲各国在1985至2019年间因医疗经济负担而陷入或加剧贫困的人口比例演变趋势。
衍生相关工作
基于该指标,衍生了一系列备受关注的学术佳作,包括利用多元回归与分解方法探究医疗支出贫困缺口与宏观经济变量(如GDP、政府卫生支出占比)之间的关联性研究。也有学者将其与营养不良、儿童死亡率等健康结局指标联动,构建多维度贫困交叉分析框架。此外,该数据支撑了部分针对特定非洲国家(如肯尼亚、加纳)的微观模拟工作,评估现金转移支付或社区健康保险计划对缓解医疗致贫的实际效果,成为健康社会政策评估领域的重要数据基石。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家因家庭卫生支出导致的贫困差距扩大问题,以每日3.20美元贫困线为基准,量化了医疗费用对贫困深度的影响。当前前沿研究方向包括利用该数据构建机器学习模型,预测健康支出贫困化风险的空间分布与时间演化趋势,并结合世界卫生组织全球健康观测站的其他指标(如疾病负担、医疗可及性),深入剖析卫生筹资不公平性的驱动力。该数据集为非洲实现全民健康覆盖及可持续发展目标中消除贫困与促进健康福祉提供了关键数据支撑,尤其在新冠疫情后全球卫生体系韧性建设的背景下,其对于评估高额自费医疗对脆弱人群的冲击具有重要的政策指导意义。
以上内容由遇见数据集搜集并总结生成



