five

electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-mppg365std

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-mppg365std
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家因家庭医疗支出导致的贫困差距增加的WHO GHO指标数据,时间跨度为1985年至2019年。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包。所有数值均来自浮点精度字段,而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了41个非洲国家,总共有298行数据。数据按国家、年份、维度(如居住地区类型)分层,每行代表一个唯一的国家×年份×维度组合。数据集模式包括指标代码、国家ISO3代码、WHO地区代码、年份、数值估计值、置信区间边界、显示字符串、维度类型和值等字段。

This dataset contains country-level observations for the WHO GHO indicator "Increase in poverty gap due to household health expenditures, expressed as a proportion of the $3.65 a-day poverty line (%, national, rural, urban)" (`FINPROTECTION_IMP_PG_365_STD`) across African nations, spanning 1985–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 41 African nations with a total of 298 rows. Data is stratified by country, year, and dimensions (e.g., residence area type), with each unique combination producing a separate row. The schema includes fields such as indicator code, country ISO3 code, WHO region code, year, numeric value, confidence interval bounds, display string, dimension types, and values.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦非洲地区,涵盖1985至2019年间41个非洲国家的官方统计数据。原始数据经系统化抽取与清洗,将关键的NumericValue字段转化为统一精度的浮点数,并保留置信区间上下限。所有观测值以Parquet格式重新封装,构建起一个结构一致、可直接用于机器学习的标准化表格数据集,其字段包括指标编码、国家ISO代码、年份、数值估计、置信区间及人口学维度标注。
使用方法
用户可利用HuggingFace的datasets库轻松加载该数据集,并将其转化为Pandas DataFrame进行探索。通过筛选dim1字段中带有特定后缀的值,可以提取全国或指定性别层级的数据。例如,仅保留以_BTSX结尾的维度即可获得两性合计的全国观测。亦可按国家ISO代码与年份排序,绘制某一国家(如肯尼亚)的时间序列曲线。此外,由于数据集标签支持分类与回归任务,开发者可直接将其输入机器学习管道以开展建模与预测。
背景与挑战
背景概述
在非洲大陆,因家庭医疗支出导致的贫困陷阱是公共卫生与经济发展领域的核心议题。该数据集由世界卫生组织全球卫生观察站创建,并经Electric Sheep Africa团队重新整理,聚焦于衡量家庭卫生支出占国际贫困线(日均3.65美元)比例所引发的贫困缺口扩大现象。数据覆盖1985年至2019年间41个非洲国家的城乡与全国层面观测值,通过FINPROTECTION_IMP_PG_365_STD指标揭示医疗费用对脆弱群体的经济冲击。作为首个面向机器学习的非洲卫生支出贫困影响标准化数据集,它为跨国比较研究、政策效果评估及可持续发展目标(SDG 3.8.2)监测提供了关键量化基础。
当前挑战
该领域面临多重挑战:首先,医疗支出致贫效应的精准量化需要跨越不同国家卫生系统、医保覆盖率和数据采集标准的差异,尤其在低收入非洲国家,家庭调查数据常面临样本不足与记录缺失问题。其次,构建过程中需处理WHO原始OData API中复杂的维度分层(如居住地类型与性别交叉),并确保从显示字符串中提取浮点数值的准确性,同时兼容1985至2019年间变更的统计口径。此外,298条观测值的小样本量限制了深度学习模型的应用,而置信区间的不完整性(部分年份缺失上限与下限值)对风险建模提出了稳健性要求。
常用场景
经典使用场景
本数据集聚焦于非洲地区因家庭卫生支出所导致的贫困差距扩大现象,以每日3.65美元贫困线为基准进行量化表达。其经典使用场景涵盖国家层面与城乡分层的时间序列分析,研究者可借助数据集中的`RESIDENCEAREATYPE`维度(涵盖全国、农村与城市)细化贫困变化的结构性差异,同时结合年代跨度(1985–2019)追踪卫生支出对贫困深化的动态影响。该数据集为标准化的面板数据格式,特别适用于构建固定效应或随机效应回归模型,以揭示经济发展、卫生政策与家庭健康负担之间的内在联系。
解决学术问题
在学术研究中,该数据集有效回应了健康经济学的核心议题——因病致贫效应的量化测度。此前非洲地区缺乏统一、可比的指标以评估卫生支出对贫困线的冲击,而本数据集提供了覆盖41个非洲国家、长达35年的标准化数据,使研究者得以突破数据瓶颈,实证检验卫生筹资体系中的灾难性支出与贫困陷阱的交互关系。其意义在于为全球健康公平性研究奠定实证基础,推动学术界从理论推演转向基于大样本的因果推断,尤其在健康保护政策效应评估、贫困脆弱性识别等领域产生了深远影响。
实际应用
在实际应用中,本数据集为非洲各国卫生政策制定与国际发展机构提供了可操作的数据工具。世界卫生组织、世界银行及非洲疾控中心可利用该指标监测千年发展目标及可持续发展目标中健康覆盖与减贫的交叉进展,识别因医保缺失或自付比例过高而陷入贫困风险的高危群体。在地方层面,数据集支持按城乡维度分解的结果展示,助力国家卫生筹资改革方案的精准设计,例如调整基本医疗包保障范围或设定分级诊疗的补贴阈值,从而提升有限公共资源在贫困人口中的配置效率。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家因家庭卫生支出导致的贫困差距扩大问题,以国际贫困线(每日3.65美元)为基准,量化了医疗负担对贫困深化的冲击。在全民健康覆盖(UHC)与减贫议程交织的全球背景下,这一指标成为评估卫生系统财务保护效力的关键工具。研究发现,非洲地区非自付医疗支出常将脆弱家庭推入更深的贫困陷阱,尤其是农村与城市边缘群体承受着不成比例的经济风险。结合世界卫生组织全球卫生观察站(GHO)的长期追踪数据,该数据集为构建预测模型、识别高风险区域以及设计针对性干预措施提供了高粒度证据,有力支撑了可持续发展目标(SDG)中“消除贫困”与“健康福祉”两大目标的协同监测与政策优化。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务