five

electricsheepafrica/africa-who-population-pushed-below-the-215-a-day-poverty-line-by

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-pushed-below-the-215-a-day-poverty-line-by
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在1985年至2019年间,因家庭医疗支出而被推至每日2.15美元贫困线以下的人口比例数据,指标代码为FINPROTECTION_IMP_NP215_POP。数据来源于WHO Global Health Observatory的OData API,并由Electric Sheep Africa重新打包为Parquet格式文件,确保了一致的模式结构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖了41个非洲国家,总共有293行数据,并按居住地区类型(农村、城市、全国)进行了细分。

This dataset contains country-level observations for the WHO GHO indicator "Population pushed below the $2.15 a day poverty line by household health expenditures (%, national, rural, urban)" (FINPROTECTION_IMP_NP215_POP) across African nations, spanning 1985–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,专门收录了1985年至2019年间非洲41个国家因家庭卫生支出而陷入日均2.15美元贫困线以下的人口比例(涵盖全国、农村和城市层面)。数据以Parquet格式重新打包,保留了统一的字段结构,所有数值均来自原始的浮点精度字段(NumericValue),而非格式化显示字符串。同时,在置信区间可用的情况下,一并包含了上下界数值,为后续的稳健性分析提供了支持。
特点
数据集的核心特点在于其细粒度的分层结构,能够区分居住区域类型(全国、农村、城市)下的不同估计值,使得用户可以根据研究需要灵活筛选。此外,数据集提供了点估计值及其置信区间(value_low和value_high),极大增强了数据的可解释性和统计可靠性。共包含293条观测记录,覆盖41个非洲国家,时间跨度长达35年,是研究非洲国家医疗支出贫困化效应的珍贵稀缺资源。
使用方法
用户可通过HuggingFace的datasets库直接加载该数据集,调用`load_dataset`函数即可获取包含所有字段的表格数据。推荐利用pandas进行后续分析,例如通过筛选`dim1`字段中值为`RESIDENCEAREATYPE_BTSX`或缺失值的行来获取全国总人口数据,或通过`country_iso3`列定位特定国家(如肯尼亚)并对其按年份排序,以构建时间序列趋势。数据集的标准化列名设计使其与机器学习工作流顺畅对接。
背景与挑战
背景概述
在全球健康治理的宏大叙事中,卫生支出对家庭经济安全的侵蚀性影响日益成为学界与政策制定者关注的核心议题。该数据集由世界卫生组织全球卫生观察站(WHO GHO)创建,并由Electric Sheep Africa团队于2022年左右重新整理封装,聚焦于非洲41个国家在1985至2019年间因家庭卫生支出而被推至每天2.15美元贫困线以下的人口比例。这一指标从宏观与微观的结合部切入,量化了“因病致贫”这一长期隐性的健康风险,为评估全民健康覆盖(UHC)的财务保护维度提供了关键实证依据。数据的发布填补了非洲大陆在卫生财政脆弱性方面的高质量、结构化空白,推动了对撒哈拉以南非洲地区健康与社会经济交叉议题的计量分析,影响力辐射至发展经济学、全球卫生政策及机器学习驱动的贫困预测等多个前沿领域。
当前挑战
该数据集所面临的核心挑战首先体现在领域问题的复杂性上:如何精确分离卫生支出与其他致贫因素(如粮食危机、经济衰退)的因果效应,是构建稳健预测模型的关键障碍;同时,指标本身为百分比形式,受限于国家间调查方法、汇率换算及购买力平价的巨大差异,导致跨地域可比性存疑。在构建过程中,数据面临三重技术挑战:其一,原始ODA API返回的粗粒度数据需经严格的清洗与一致性校验,以剔除因显示字符串格式错误或缺失值引入的噪声;其二,时序跨度长达34年,期间多国发生政权更迭或统计口径调整,导致部分年份观测值稀疏或完全缺失;其三,亚维度(城乡、性别)的分层记录虽丰富了分析维度,却带来了多粒度聚合时的维度爆炸与样本量不足(仅293行)的矛盾,使传统统计推断与深度学习方法均面临过拟合与统计功效衰减的严峻考验。
常用场景
经典使用场景
在卫生经济学与全球健康治理领域,该数据集被广泛用于评估灾难性卫生支出对贫困脆弱人群的冲击程度。研究人员通常利用其提供的国家、农村与城市分层的贫困线以下人口比例指标,结合时间序列数据,追踪撒哈拉以南非洲国家在1985至2019年间因家庭医疗支出陷入极端贫困的动态变化。这一场景的核心在于通过数值化手段量化医疗财务保护不足的社会代价,为政策干预提供可比较的基线证据。
衍生相关工作
该数据集驱动了一系列衍生研究,包括基于回归分析的医疗支出贫困效应跨国比较模型、利用机器学习预测贫困脆弱性随时间演变的时序建模,以及结合地理信息系统(GIS)对贫困与卫生资源空间错配的探索。部分工作进一步将其与WHO GHO其他指标(如自付医疗支出占比、医保覆盖率)整合,构建了多维财务保护指数,或通过分解分析揭示性别、城乡维度下的不平等差异,深化了灾难性卫生支出领域的方法论创新。
数据集最近研究
最新研究方向
在全球卫生筹资与减贫交叉领域,该数据集聚焦于家庭卫生支出将人口推至每日2.15美元贫困线以下的脆弱性测度,反映了非洲地区因病致贫的严峻现实。当前前沿研究方向集中于利用该数据构建机器学习模型,以预测不同国家在城乡与全国层面因灾难性卫生支出导致的贫困加剧趋势,并与WHO全球健康观测站的其他融资保护指标联动,探索卫生筹资公平性与可持续发展目标间的动态关系。尤其在后疫情时代,该数据集为分析卫生系统冲击对脆弱人群经济安全的长期影响提供了关键实证基础,助力制定精准的卫生政策干预与跨国比较研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务