electricsheepafrica/africa-who-population-pushed-below-a-relative-poverty-line-by
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-pushed-below-a-relative-poverty-line-by
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在1985-2021年间,因家庭医疗支出而被推至相对贫困线以下的人口比例数据(60%的中位数每日人均消费或收入)。数据来源于WHO Global Health Observatory,并经过Electric Sheep Africa重新打包为Parquet格式,便于机器学习使用。数据集包括44个非洲国家的350条记录,涵盖国家、农村和城市三个居住区域类型。每个记录包含指标代码、国家ISO3代码、WHO区域代码、年份、数值估计值、置信区间边界、显示字符串、维度类型和值等信息。
This dataset contains country-level observations for the WHO GHO indicator "Population pushed below a relative poverty line by household health expenditures - 60% of median daily per capita consumption or income (%, national, rural, urban)" (`FINPROTECTION_IMP_NPRELPL_POP`) across African nations, spanning 1985–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本研究数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,经系统化采集与标准化处理后,整合为统一格式的Parquet文件。数据集聚焦非洲地区,筛选WHO AFRO区域内的44个非洲国家,时间跨度涵盖1985年至2021年,共计350条观测记录。每条记录均以浮点精度的NumericValue字段作为核心数值,并附带置信区间上下界(value_low, value_high)以增强统计可靠性。数据按国家、年份及子维度(如城乡类型)进行结构化组织,形成多层级观测单元。
使用方法
用户可通过HuggingFace Datasets库便捷加载数据:使用load_dataset函数获取数据集后,调用to_pandas()方法转换为DataFrame格式进行分析。建议根据研究需求筛选特定子维度,例如通过过滤dim1字段获取全国总体数据(如以_BTSX结尾的条目),或按国家代码(如country_iso3 == 'KEN')提取特定国家的时间序列。数据可直接用于卫生经济影响评估、贫困脆弱性建模等回归或分类任务,亦可作为面板数据进行纵向对比分析。
背景与挑战
背景概述
在全球公共卫生领域,灾难性医疗支出对家庭经济状况的冲击一直是发展经济学与卫生政策研究的重要议题。该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)创建,经Electric Sheep Africa团队重新打包为机器学习就绪格式,聚焦非洲地区因家庭卫生支出而被推至相对贫困线以下的人口比例,以日均消费或收入的60%为阈值,覆盖1985年至2021年间44个非洲国家的国家级、农村及城市分层数据。作为WHO官方指标FINPROTECTION_IMP_NPRELP_POP的标准化开放数据,它填补了非洲卫生经济脆弱性定量研究的空白,为评估全民健康覆盖进展、设计针对性社会保护政策提供了关键证据基础,对推动非洲大陆卫生筹资公平性分析具有显著影响力。
当前挑战
该数据集所应对的核心领域挑战在于量化卫生支出如何加剧贫困,即解决卫生筹资体系中的隐性风险保护不足问题,具体表现为难以精确捕捉低收入家庭因病致贫的动态过程。构建过程中的挑战包括:数据跨度长达36年但仅含350条观测值,导致样本稀疏性与时间序列不连续性;不同国家数据收集标准不一,城乡分层(RESIDENCEAREATYPE)与性别维度(dim1)的缺失值及置信区间缺失增加了建模难度;原始WHO API中的浮点数值与实际展示字符串间存在精度差异,需要严格的数据清洗以确保机器学习目标变量的可靠性。
常用场景
经典使用场景
该数据集最经典的使用场景在于对非洲各国因医疗支出而陷入相对贫困的人口比例进行量化建模。研究者可据此评估不同国家的医疗保障脆弱性,通过构建回归或分类模型,揭示医疗财务风险(catastrophic health expenditure)与社会经济特征之间的关联。数据涵盖城乡与全国层面的分层信息,便于深入分析贫困的地理差异与时间演变趋势。
解决学术问题
该数据集有效支撑了医疗财务保护与贫困关系这一关键学术问题的研究。它使学者能够系统衡量‘因病致贫’现象在非洲的蔓延程度,并评估国家卫生政策在减缓贫困方面的成效。通过追踪1985至2021年间44个非洲国家的数据,研究可揭示卫生支出如何加剧收入不平等,为健康经济学中的灾难性医疗支出理论提供实证证据。
实际应用
在实际应用中,该数据可为国际组织(如WHO、世界银行)制定非洲地区的健康保障策略提供参考。公共卫生部门可借助该数据分析农村与城市贫困受医疗支出的冲击差异,进而优化医疗补贴政策、设计社会健康保险方案。此外,它还可用于构建预警系统,识别高财务风险国家,指导资源配置与干预优先级的设定。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家因家庭卫生支出而陷入相对贫困的人口比例,以每日人均消费或收入中位数的60%为阈值,覆盖国家、城乡及时间维度(1985-2021年)。在公共卫生经济学的前沿研究中,这一指标被广泛用于评估全民健康覆盖(UHC)进程中的财务风险保护水平,尤其是在全球卫生支出持续攀升与疫情后经济复苏的背景下。研究热点包括:结合世界卫生组织(WHO)的全球卫生支出数据库,分析非洲国家卫生自付费用对贫困脆弱性的动态影响;利用该数据的城乡分层特征,探究城市化进程中农村与城市人口因医疗费用致贫的差异机制;以及通过面板数据模型,预测卫生筹资政策调整对减贫效果的长期影响。该数据集为监测联合国可持续发展目标(SDG)中与健康相关的贫困指标提供了关键证据,并推动非洲区域卫生政策从单纯的疾病控制向综合性财务风险防范转型。
以上内容由遇见数据集搜集并总结生成



