five

electricsheepafrica/africa-who-population-pushed-further-below-a-relative-poverty-line-by

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-pushed-further-below-a-relative-poverty-line-by
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“因家庭健康支出而被推至相对贫困线以下的人口 - 占每日人均消费或收入中位数的60%(%,全国、农村、城市)”在非洲国家的国家级观察数据,时间跨度为1985年至2021年。这是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从世界卫生组织全球健康观察OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Population pushed further below a relative poverty line by household health expenditures - 60% of median daily per capita consumption or income (%, national, rural, urban)" (`FINPROTECTION_IMP_PRELPL_POP`) across African nations, spanning 1985–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的公开数据接口,聚焦于非洲国家因家庭卫生支出而被迫进一步滑落至相对贫困线以下的人口比例,贫困线设定为每日人均消费或收入中位数的60%。数据覆盖1985年至2021年间的44个非洲国家,共计907条观测记录。原始数据通过OData API获取后,经由统一的结构化流程重组成Parquet格式文件。所有数值均采用浮点精度的`NumericValue`字段,而非显示字符串,同时保留了置信区间上下界。数据集还纳入了亚组维度,如年龄段、居住地类型、性别及家庭年龄构成,每条记录对应国家-年份-维度的唯一组合。
使用方法
使用者可通过HuggingFace的`datasets`库便捷加载数据,调用`load_dataset`函数即可获取训练集。加载后,利用Pandas将数据转化为DataFrame格式,便于后续操作。建议在分析前对亚组维度进行筛选,例如通过筛选`dim1`字段中结尾为`_BTSX`的条目获取两性合并的全国层面数据,或按国家代码筛选特定国家的时间序列。数据已预置为统一Schema,可直接适用于表格型分类或回归任务。用户可结合`value_numeric`作为主要目标变量,并利用`value_low`与`value_high`进行不确定性评估,或按年份排序后开展纵向趋势研究。
背景与挑战
背景概述
在全球卫生公平性研究的宏观背景下,由世界卫生组织全球卫生观察站(WHO GHO)创建、并经Electric Sheep Africa团队于2021年再整理发布的非洲贫困人口健康支出数据集,聚焦于一个长期被忽视的议题——家庭健康支出如何将更多人口推向相对贫困线以下。该数据集记录了1985年至2021年间44个非洲国家的观测数据,以每日人均消费或收入中位数的60%作为贫困线标准,量化了因健康支出而陷入更深贫困的人口比例。作为首个面向机器学习的统一非洲数据集集合的一部分,它填补了非洲地区健康金融保护领域结构化、可复现数据的空白,为评估全民健康覆盖进展及卫生系统绩效提供了关键基准,深刻影响了卫生经济学与政策研究。
当前挑战
所解决的领域核心挑战在于量化健康支出的致贫效应,尤其是在非洲大陆缺失细致、长时序微观调查数据的情况下,这一指标需跨越国家、城乡、性别及年龄组等多维度分层进行精确估算。构建过程中面临的主要困难包括:从WHO OData API中清洗并整合来源不一、缺失值普遍的跨国数据;将离散的置信区间信息与点估计值统一为标准化Parquet格式;处理因维度组合爆炸生成的稀疏多分组观测(如907条记录覆盖44国、多维度分层),同时确保跨年、跨国数据在统计口径上的可比性与联邦化可用性,为下游机器学习任务提供无偏、鲁棒的输入特征。
常用场景
经典使用场景
在健康经济学与全球卫生治理领域,该数据集的核心用途在于量化因病致贫的深度。经典的使用场景是,研究者利用该数据集中'因自付医疗支出而被进一步推至相对贫困线以下的人口比例'这一指标,结合国家层面的人均消费中位数,评估不同非洲国家(如肯尼亚、加纳等44国)在1985至2021年间,家庭卫生支出对贫困人口的'下沉效应'。通过按城乡、性别及年龄组(60岁以上及以下)进行分层分析,学者能够精准追踪特定脆弱群体在医疗负担下的贫困恶化轨迹,从而揭示医疗卫生融资体系中的不平等性。
解决学术问题
该数据集直接回应的核心学术问题是:'卫生支出如何加剧已处于贫困状态人群的福祉恶化?' 传统贫困研究多关注卫生支出是否使家庭'落入'贫困线以下,而此数据聚焦于贫困深度的动态变化——即已被推至贫困线以下的人口,因健康支出的进一步冲击而陷入更深的相对贫困。这一视角的转变填补了现有文献对'贫困放大效应'的量化空白。其意义在于,为验证'健康休克导致贫困陷阱'的理论假说提供了跨国家、跨年代的面板证据,并推动了世界卫生组织'全民健康覆盖'监测框架中'财务保护'维度的实证基础建设。
实际应用
在实际决策层面,该数据集为非洲各国卫生政策制定者提供了关键预警信号。以2020年前后的卢旺达或埃塞俄比亚为例,公共卫生部门可据此识别健康保险报销比例不足导致的'贫困深化'高风险区域,从而有针对性地调整医保共付率或扩大慢性病药品补贴范围。同时,世界卫生组织非洲区域办事处(AFRO)利用该数据对'全民健康覆盖'进度进行国家间排名评估,确定技术援助的优先国家。在新冠疫情后时期,该数据还被用于模拟疫情期间就医延迟与自付费用突增对脆弱家庭贫困指数的叠加影响,辅助设计减贫与卫生筹资的协调干预方案。
数据集最近研究
最新研究方向
围绕世界卫生组织全球卫生观察站(WHO GHO)发布的非洲地区因家庭卫生支出而陷入相对贫困线以下的人口比例数据集,当前前沿研究聚焦于医疗健康财务风险与贫困脆弱性的交叉领域。该数据集通过追踪1985至2021年间44个非洲国家的微观数据,刻画了公共卫生支出对家庭经济状况的侵蚀效应,尤其揭示了老年群体(60岁以上)与农村居民在自付医疗费用冲击下承受的额外贫困负担。结合全球新冠大流行后非洲医疗系统承压的背景,研究者借助多维度分层指标(如性别、居住地、家庭年龄构成),构建了预测医疗致贫风险的机器学习模型,并实证检验了全民健康覆盖(UHC)政策在降低此类贫困深化指标中的边际效应。该数据集的核心贡献在于为算法驱动的健康经济学分析提供了结构化、可复现的基准,推动了算法公平性评估——即识别哪些亚群在现有卫生筹资模式下被系统性推向更深层的相对贫困,从而为WHO与非洲疾控中心调整区域健康保障策略提供数据支撑。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务