five

electricsheepafrica/africa-who-population-pushed-further-below-the-365-a-day-poverty-line

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-pushed-further-below-the-365-a-day-poverty-line
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在1985年至2019年间,因家庭健康支出而进一步低于每天3.65美元贫困线的人口的百分比数据。数据来源于WHO Global Health Observatory,并由Electric Sheep Africa重新打包为Parquet格式。数据集包含国家、年份、数值估计值、置信区间等信息,并提供了详细的模式描述和使用示例。

This dataset contains country-level observations for the WHO GHO indicator "Population pushed further below the $3.65 a day poverty line by household health expenditures (%, national, rural, urban)" (`FINPROTECTION_IMP_P365_POP`) across African nations, spanning 1985–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的公开数据,聚焦于非洲地区居民因家庭卫生支出而被进一步推至每日3.65美元贫困线以下的人口比例。数据通过OData API直接采集,并经过系统化重包装为Parquet格式,确保一致的列式存储架构。所有数值均取自高精度的`NumericValue`字段,而非显示字符串,同时保留了置信区间上下限(`value_low`、`value_high`)以增强统计可靠性。时间跨度覆盖1985年至2019年,涵盖41个非洲国家,共计289条记录,且按居住地类型(国家、农村、城市)进行分层。
特点
本数据集的一个显著特色是其结构化分层设计,通过`dim1`与`dim2`字段存储如居住地类型、性别等子维度信息,使得每个国家-年份组合可对应多条记录,便于细粒度分析。此外,数据严格限定于WHO非洲区域(AFRO),并内置了指标代码、国家ISO代码、WHO区域代码等标准元数据字段,极大提升了跨数据集的可交互性与机器学习任务的就绪度。数据还提供了置信区间信息,使研究者能够评估估计值的不确定性,适合用于回归与分类建模。
使用方法
用户可通过HuggingFace的`datasets`库直接加载该数据集,调用`load_dataset`函数即可获取训练集,并利用`to_pandas()`方法转换为DataFrame进行后续分析。为筛选特定子群体,例如仅保留全国层面且两性合并的数据,可对`dim1`字段进行字符串后缀匹配(如`_BTSX`)。针对时间序列分析,可按`country_iso3`字段筛选单一国家(如肯尼亚),并按年份排序。该数据集天然适用于构建卫生经济与贫困关联的预测模型,也可作为多维度健康指标评估中的解释变量。
背景与挑战
背景概述
在非洲地区,医疗支出对家庭经济状况的冲击尤为显著,尤其是对于已处于贫困线附近的脆弱群体。世界卫生组织全球卫生观察站(WHO GHO)于2019年发布了“因家庭卫生支出而进一步低于日均3.65美元贫困线的人口比例”这一指标,旨在量化医疗自付费用如何将更多家庭推向深度贫困。该数据集由Electric Sheep Africa团队整理,覆盖1985年至2019年间41个非洲国家的289条观测记录,并按国家、城乡及性别等维度进行分层。这一数据为研究非洲医疗卫生筹资的公平性、贫困陷阱的形成机制以及可持续发展目标(SDGs)中健康与减贫的协同效应提供了关键支撑,成为全球卫生经济与公共政策领域的重要基础资源。
当前挑战
该数据集所解决的领域核心挑战在于:如何精确衡量医疗支出对贫困人口生活水平的二次打击,即已有的贫困人口因医疗自付费用而进一步陷入更深层次的贫困。这一指标超越了传统的贫困发生率统计,揭示了健康冲击对穷人的累积性负面影响。在数据集构建过程中,主要挑战包括:数据来源的碎片化——WHO GHO数据通过OData API获取,不同国家及年份的统计口径和更新频率存在差异;数据维度的复杂性——指标按居住地类型(国家、农村、城市)进行分层,导致同一观测点可能产生多条记录,需要谨慎处理维度过滤与聚合;以及数据质量的不确定性——部分观测值缺乏置信区间或存在缺失,影响了时间序列分析与跨国比较的稳健性。
常用场景
经典使用场景
该数据集聚焦于非洲国家因家庭卫生支出导致人口进一步跌入日均3.65美元贫困线以下的比例,涵盖了1985年至2019年间41个非洲国家的国家级、农村和城市分层观测数据。经典使用场景包括利用该数据构建回归模型,预测健康支出对贫困深化的影响程度,或通过分类任务识别哪些国家、年份及居住区域类型面临更高的贫困恶化风险。数据集的精细化分层结构(如城乡差异)使得研究者能够剖析卫生支出贫困效应的空间异质性,从而为精准干预提供量化依据。
解决学术问题
数据集主要解决了全球健康与贫困交叉领域中的核心学术问题:量化家庭卫生支出对贫困深化的边际贡献,并识别其在不同地理与时间尺度下的动态特征。以往研究常受限于数据稀疏或口径不一,而该数据集通过统一规范的WHO GHO指标,覆盖了长达34年的非洲面板数据,使学者能够验证‘因病致贫’的理论假说,并控制时间固定效应和区域异质性。其意义在于为健康公平性研究提供了可靠的统计基础,推动了关于全民健康覆盖(UHC)政策效果的实证评估。
衍生相关工作
该数据集衍生的相关工作集中在健康经济学和机器学习交叉领域。典型工作包括:基于时序模型(如LSTM)预测非洲国家未来5年的卫生支出贫困率,利用地理加权回归揭示空间依赖性,或通过SHAP值解释随机森林模型中各因素(如城镇化率、人均GDP)对贫困深化的贡献权重。此外,该数据集常与WHO其他指标(如免疫覆盖率、医生密度)联合分析,构建复合脆弱性指数,推动‘数据驱动型健康政策’的学术范式发展。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务