five

electricsheepafrica/africa-who-population-pushed-below-the-320-a-day-poverty-line-by

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-pushed-below-the-320-a-day-poverty-line-by
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含WHO GHO指标因家庭医疗支出而被推至每日3.20美元贫困线以下的人口比例(%,全国、农村、城市)(FINPROTECTION_IMP_NP310_POP)在非洲国家的国家级观测数据,时间跨度为1985年至2019年。数据集是[Electric Sheep Africa]集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Population pushed below the $3.20 a day poverty line by household health expenditures (%, national, rural, urban) (FINPROTECTION_IMP_NP310_POP) across African nations, spanning 1985–2019. It is part of the [Electric Sheep Africa] collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家因家庭卫生支出而被推至每日3.20美元贫困线以下的人口比例(以百分比计,涵盖全国、农村和城市层面)。Electric Sheep Africa团队以统一的可机器学习模式对其进行重新打包,所有数值均取自精确浮点字段NumericValue,而非显示字符串。数据以Parquet格式存储,保留了置信区间上下限字段,并涵盖了1985年至2019年间39个非洲国家的306条观测记录。
特点
数据集的核心特点在于其层次化的子维度结构,依据居住地类型(全国、农村、城市)进行分层,每个国家-年份-维度的唯一组合生成独立行,便于细粒度分析。此外,数据集具备一致的Schema设计,包含指示符代码、国家ISO3代码、WHO区域、年份、点估计值及其置信区间、显示字符串和更新时间戳等字段。其标签包括非洲、健康、WHO和GHO等,适用于分类与回归任务,且数据量小于1000条,轻量而聚焦。
使用方法
使用者可通过HuggingFace的datasets库直接加载数据集,调用load_dataset函数获取训练集,并转换为Pandas DataFrame进行后续操作。为聚焦于特定子群体,可按维度字段筛选,例如通过处理dim1列以获取全国或城乡数据,或利用country_iso3列提取单国时间序列。数据集的标准化字段设计使得模型训练中的特征工程与标签提取更为便捷,特别适合用于分析卫生支出对贫困影响的跨国比较研究。
背景与挑战
背景概述
该数据集来源于世界卫生组织全球卫生观察站(WHO GHO),由Electric Sheep Africa团队于2023年左右整理并发布在HuggingFace平台上,聚焦于非洲国家因家庭卫生支出而被推至每日3.20美元贫困线以下的人口比例(涵盖全国、农村和城市层面)。核心研究问题在于量化卫生支出对非洲地区居民经济脆弱性的影响,尤其是如何加剧贫困深度。作为一项跨1985至2019年、覆盖39个非洲国家的纵向数据,该集成为健康经济学、贫困研究与全球卫生政策评估提供了标准化、机器可读的指标,对推动非洲地区卫生筹资公平性与可持续发展目标(SDG)相关研究具有重要支撑作用。
当前挑战
该数据集所解决的领域问题是评估卫生支出导致的经济贫困风险,其核心挑战在于卫生支出对贫困的因果效应常混杂于收入波动、社会保障缺失等结构性因素中,且贫困线的国际比较需考虑购买力平价差异。构建过程中面临多重困难:数据稀疏性(仅306条观测)、年份与国别覆盖不连续(1985–2019间存在大量缺失)、置信区间可变性(部分观测缺少上下界),以及分层维度(城乡、性别)不统一导致聚合分析时需谨慎处理偏倚。此外,原始数据来源于不同国家卫生账户系统,其统计口径与调查质量参差不齐,需在清洗时平衡可比性与信息损失。
常用场景
经典使用场景
该数据集聚焦于非洲国家因家庭卫生支出而陷入每日3.20美元贫困线以下的人口比例,覆盖1985至2019年间39个国家的观测数据。其经典使用场景在于评估医疗支出对居民经济脆弱性的直接冲击,通过整合国家、农村与城市层面的分层数据,研究者能够量化因病致贫的广度与深度。数据集中包含点估计值与置信区间,为构建回归模型或分类任务提供了坚实基础,尤其适用于分析医疗卫生融资政策对贫困动态的长期影响。
衍生相关工作
基于此数据集,研究者已衍生出多项经典工作。一部分工作聚焦于构建预测模型,利用时序特征预估未来医疗支出对贫困率的影响,并结合气候、流行病等变量揭示复合脆弱性。另有研究将其与家庭消费调查数据融合,通过因果推断方法量化医保覆盖率与贫困线以下人口变动的剂量反应关系。这些工作不仅深化了对非洲卫生系统的理解,还催生了开放获取的机器学习基准,加速了跨区域比较研究的进程。
数据集最近研究
最新研究方向
当前,该数据集聚焦于非洲国家因自付医疗支出而陷入贫困的人口比例,其前沿研究方向契合了全球健康筹资与贫困陷阱的交叉议题。随着世界卫生组织持续推动全民健康覆盖,研究者利用该数据评估灾难性卫生支出对脆弱人群的经济冲击,尤其在新冠疫情后卫生系统韧性不足的背景下,这些数据成为量化医疗财务保护缺口的关键工具。通过剖析城乡与不同居住区域的差异,该数据集助力揭示结构性不平等,为制定针对性减贫政策与优化健康保险方案提供了实证基础,其影响延伸至可持续发展目标中消除贫困与促进健康福祉的协同监测。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务