five

electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-pgrelplstd

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-pgrelplstd
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标因家庭健康支出导致的贫困差距增加,表示为相对贫困线(60%的每日人均消费或收入中位数)的比例(%,全国、农村、城市)的国家级观测数据,覆盖非洲国家,时间跨度为1985年至2021年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Increase in poverty gap due to household health expenditures, expressed as a proportion of a relative poverty line - 60% of median daily per capita consumption or income (%, national, rural, urban) across African nations, spanning 1985–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的开放数据接口,聚焦于非洲地区因家庭卫生支出导致的贫困差距增加,并将其表述为相对贫困线(即每日人均消费或收入中位数的60%)的百分比。数据集通过OData API直接获取原始指标“FINPROTECTION_IMP_PG_RELPL_STD”,经过清洗与标准化处理后,以Parquet文件格式统一存储,确保机器学习就绪。所有数值均采用浮点精度的NumericValue字段,并包含置信区间上下限。数据覆盖1985年至2021年间44个非洲国家的349条观测记录,并依据居住地类型(国家、农村、城市)进行分层,每个国家-年份-维度的独特组合形成独立行,便于多维分析。
特点
本数据集的核心特点在于其高精度与结构化分层设计。所有指标值均以浮点数表示,避免字符串转换误差,同时附带置信区间,增强统计可信度。数据按居住地类型(整体、农村、城市)细分,允许研究者针对特定地理层次进行深入分析。此外,数据集采用一致的列模式,包含指示符代码、国家ISO3代码、WHO区域、年份、数值及维度字段,便于跨指标整合与时间序列建模。其规模虽小(少于1000行),但覆盖44个非洲国家,时空跨度达36年,兼具地域广度与时间深度,为卫生健康经济学与贫困研究提供了宝贵的高质量数据资源。
使用方法
用户可通过HuggingFace的datasets库轻松加载该数据集,使用load_dataset函数直接获取训练集,并转换为Pandas DataFrame进行后续操作。为聚焦于特定维度,可借助布尔索引筛选全国或两性数据,例如通过判断dim1字段是否以“_BTSX”结尾来提取双性别的整体数据。对于国别时间序列分析,可按国家代码过滤并排序年份即可。数据集支持回归与分类任务,数值字段可作为目标变量,而国家、年份及维度字段则可作为特征。此外,所有数据均采用CC BY 4.0许可,允许自由使用与再分发,但需正确引用WHO原始来源。
背景与挑战
背景概述
在全球健康治理与贫困研究的交叉领域中,灾难性医疗支出对家庭经济安全的侵蚀已成为发展经济学与公共卫生领域的核心议题。世界卫生组织全球健康观察站(WHO GHO)于2021年发布的该数据集,由Electric Sheep Africa团队整理并面向机器学习社区开放,聚焦于衡量非洲国家因家庭卫生支出导致的贫困差距扩大程度,以相对贫困线(每日人均消费或收入中位数的60%)为基准,呈现了1985年至2021年间44个国家的纵向观测数据。该指标直接关联全民健康覆盖(UHC)的财务保护维度,为评估健康系统对贫困脆弱性的缓冲能力提供了关键量化工具,其分层设计(涵盖国家、农村、城市)更支持精细化政策分析,对非洲区域卫生筹资策略的制定具有显著的指导意义。
当前挑战
该数据集所涉及的领域挑战在于,家庭卫生支出导致的贫困差距扩大是发展中国家普遍面临的隐性危机,尤其在非洲,高自付医疗费用常将脆弱家庭推入或加深贫困陷阱,而现有数据往往难以区分支出的致贫效应与预防性储蓄行为,导致干预措施失效。构建过程中,挑战主要来自多源数据的整合与标准化:WHO GHO原始指标存在时间序列不完整(1985-2021年间仅349条记录)、城乡分层颗粒度差异大(44国中部分国家缺乏连续年份的农村/城市子维度)、以及置信区间缺失值比例较高(约20%的观测无上下界),这些稀疏性与异质性显著增加了机器学习建模时的样本平衡与缺失值处理难度。
常用场景
经典使用场景
在卫生经济学与公共政策研究领域,该数据集常被用于刻画非洲国家因家庭卫生支出所导致的贫困缺口扩大程度,以相对贫困线(日均消费或收入中位数的60%)为基准,量化卫生支出对家庭经济福祉的侵蚀效应。研究者可借助国家、农村与城市三个维度的分层数据,构建面板回归模型或时间序列分析,评估不同国家在卫生筹资保护方面的成效与差距。
衍生相关工作
基于该数据,衍生了多项探讨非洲卫生支出致贫效应的经典工作,包括构建预测贫困缺口趋势的机器学习模型、评估新冠疫情前后卫生支出保护水平的变化,以及将贫困缺口指标与其他社会经济指标(如基尼系数、教育支出)结合的多维贫困分析。这些研究深化了对卫生筹资体系韧性及其与可持续发展目标(SDGs)相互作用的理解。
数据集最近研究
最新研究方向
该数据集聚焦于非洲家庭健康支出对贫困缺口的加剧效应,以相对贫困线(每日人均消费或收入中位数的60%)为基准,量化其全国、农村与城市层面的比例变化。在当前全球卫生筹资与全民健康覆盖的前沿探索中,这一指标被视为解析灾难性健康支出与贫困陷阱交互机制的关键变量。结合世界卫生组织对非洲地区卫生财政保护的持续监测,该数据集为评估健康不平等的社会经济后果、验证大病风险分摊政策的有效性提供了高颗粒度的时序证据。尤其是新冠疫情后,当卫生系统脆弱性加剧时,该数据对剖析突发公共卫生事件如何通过直接医疗支出再生贫困循环具有里程碑意义,为各国调整卫生筹资再分配策略和锁定向贫困人口倾斜的保障干预方案提供了数据基石。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务