five

electricsheepafrica/africa-who-population-pushed-further-below-the-190-a-day-poverty-line

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-pushed-further-below-the-190-a-day-poverty-line
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“因家庭医疗支出而进一步低于每天1.90美元贫困线的人口(%,全国、农村、城市)”在非洲国家的国别观察数据,时间跨度为1985年至2019年。该数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO全球健康观察站OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Population pushed further below the $1.90 a day poverty line by household health expenditures (%, national, rural, urban)" (`FINPROTECTION_IMP_P190_POP`) across African nations, spanning 1985–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球健康观察站的OData API,聚焦于非洲地区因家庭卫生支出而进一步陷入日均1.90美元贫困线以下的人口比例。数据经过系统化清洗与重构,以Parquet文件格式统一存储,保留了原始接口中的浮点精度数值作为核心指标。构建过程中,仅采纳NumericValue字段而非显示字符串,确保数值准确性,同时纳入置信区间上下界以增强统计可靠性。数据集覆盖1985至2019年间39个非洲国家,共计771条观测记录,每条记录均包含国家代码、年份、维度分类及更新时间戳等标准化字段。
特点
该数据集的核心特点在于其多维分层结构,支持按年龄组、居住区域类型、性别及家庭构成等维度进行精细探讨。例如,年龄组可细分为60岁以上与以下,居住区域涵盖国家总体、农村与城镇,性别区分男女及合计。每个国家-年份-维度的组合形成独立行,便于研究者根据具体分析需求灵活筛选或聚合。此外,数据集保留了WHO原始数据中的置信区间信息,为后续统计推断提供了基础。整体上,这一结构化设计使其成为机器学习项目中多样化探索与建模的理想数据源。
使用方法
数据集可通过HuggingFace的datasets库直接加载,调用load_dataset函数即可获得训练集,并转换为Pandas DataFrame进行后续操作。为聚焦于某一特定维度,例如仅分析国家层面的两性合计数据,可通过筛选dim1字段中以'_BTSX'结尾的行或空值来实现。对于国别时间序列分析,可按country_iso3字段过滤特定国家并依据年份排序。此外,用户亦可利用dim1与dim2字段对年龄、居住区域或家庭构成等子维度进行精细化切片,或跨维度聚合以构建宏观视角,满足分类与回归等多元建模需求。
背景与挑战
背景概述
该数据集由世界卫生组织全球卫生观察站(WHO GHO)创建,并由Electric Sheep Africa团队整理,聚焦于非洲国家因家庭卫生支出而导致贫困线以下人口比例进一步恶化的现象。数据涵盖1985年至2019年间39个非洲国家的观测值,核心研究问题在于量化医疗健康支出对贫困动态的直接影响,尤其关注城乡及不同年龄群体的差异。通过提供标准化、机器学习友好的格式,该数据集为公共卫生、发展经济学及政策评估领域的研究提供了宝贵资源,推动了非洲区域健康财务风险保护的量化分析。
当前挑战
数据集面临的挑战首先来自领域问题:医疗支出导致的贫困加剧(即健康致贫)在非洲尤为严峻,但现有数据往往稀疏或口径不一,难以精确刻画其多维影响(如城乡、性别、年龄分层)。构建过程中,挑战包括从WHO OData API提取并整合跨多年份、多国家及多维度(如居住地类型、家庭结构)的异构数据,确保‘数值’字段的精度与一致性,同时处理置信区间缺失和维度组合爆炸问题。此外,非洲国家数据覆盖的时空不连续性和统计口径差异也增加了归一化与机器学习适配的难度。
常用场景
经典使用场景
该数据集的核心应用在于量化非洲地区因家庭医疗健康支出而被进一步推至国际贫困线(日均1.90美元)以下的人口比例。研究者可借助其分层结构(如城乡、性别、年龄组)构建回归或分类模型,剖析医疗负担对多维贫困恶化的驱动效应。数据覆盖1985至2019年间39个非洲国家,时间跨度与地域广度使其成为评估全民健康覆盖(UHC)进展、监测可持续发展目标(SDG)中减贫与健康公平交叉议题的基石资源。通过将置信区间纳入分析,学者还能在不确定性框架下更稳健地推断政策干预的边际影响。
衍生相关工作
该数据集衍生出若干标志性学术工作:其一,利用面板门槛回归模型验证了医疗支出对贫困深度影响的非线性阈值效应;其二,结合DHS(人口健康调查)微观数据,构建了多层贝叶斯模型以分解国家-个体层面的风险暴露;其三,催生了‘健康贫困脆弱性指数’这一综合指标,被后续研究用于评估非洲社保体系的缓冲能力。此外,部分工作将本数据与气象数据耦合,揭示气候冲击通过疾病负担间接加剧贫困的传导路径。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区因家庭卫生支出而进一步滑落至日均1.90美元贫困线以下的人口比例,覆盖1985至2019年间39个非洲国家的时空维度。在健康经济学与可持续发展领域,这一指标被视为衡量'灾难性卫生支出'导致贫困深化的关键代理变量。当前研究前沿正将其与全球卫生筹资机制、全民健康覆盖(UHC)进程及新冠疫情冲击下的脆弱性评估相联动,尤其关注城乡与代际差异对贫困陷阱的放大效应。通过多层级分层变量(如年龄、性别、居住地类型),该数据为机器学习驱动的贫困预测模型与政策干预靶向模拟提供了结构化训练样本,助力国际组织与区域机构量化卫生支出的隐性经济代价,推动从宏观贫困率到微观户级风险的范式迁移。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务