five

electricsheepafrica/africa-who-population-pushed-below-the-190-a-day-poverty-line-by

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-pushed-below-the-190-a-day-poverty-line-by
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在1985年至2019年间,因家庭医疗支出而被推至每日1.90美元贫困线以下的人口百分比的国别观察数据。数据集是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)系列的一部分,这是一个统一的、适合机器学习使用的非洲数据仓库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator "Population pushed below the $1.90 a day poverty line by household health expenditures (%)" (`FINPROTECTION_IMP_NP190_POP`) across African nations, spanning 1985–2019. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于世界卫生组织全球健康观测站(WHO GHO)的OData API构建,聚焦于非洲地区因家庭卫生支出而被迫陷入日均1.90美元贫困线以下的人口比例。数据覆盖1985年至2019年间39个非洲国家,共包含298条观测记录。原始数据经由OData接口获取后,被统一重构为Parquet格式文件,确保架构一致性。所有数值均来源于高精度的浮点型字段NumericValue,而非格式化显示字符串。同时,数据集中纳入了置信区间上下限(value_low与value_high),并在子维度上保留了居住地类型(如农村、城市及总体)的细分信息,为多维度分析提供支撑。
特点
该数据集的核心特点在于其针对非洲地区健康经济脆弱性的精准刻画。指标聚焦于卫生支出对贫困的推动作用,直接关联联合国可持续发展目标中的健康与减贫议题。数据经过严格筛选,仅保留WHO非洲区域(AFRO)的观测值,并统一采用ISO3166-1 alpha-3国家代码和整数年份表示,便于跨国家、跨时间序列的建模分析。此外,数据集包含丰富的子维度字段,如居住地类型和置信区间,允许研究者根据分析需求灵活聚合或过滤不同分层,从而避免因数据粒度不一致导致的统计偏差。
使用方法
该数据集以HuggingFace Datasets库为核心使用接口,支持通过`load_dataset`函数一键加载。用户可将数据直接转换为Pandas DataFrame进行后续分析。为获取全国层面的估计值,建议过滤dim1字段中所有以'_BTSX'结尾或缺失的行,以排除性别等分层干扰。对于单一国家的时间序列分析,可按ISO3代码筛选并结合年份排序。数据集中已预留置信区间字段,适合用于不确定性量化或误差棒可视化。若需处理不同层级的聚合,可灵活利用dim1和dim2字段进行分组统计,以确保分析结论的稳健性。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观测站(GHO)编制,经Electric Sheep Africa团队重新封装后发布于HuggingFace平台,创建时间涵盖1985至2019年间的非洲国家观测数据。核心研究问题聚焦于因家庭卫生支出而陷入每日1.90美元贫困线以下的人口比例,旨在揭示医疗健康支出对贫困动态的加剧效应。作为非洲大陆统一化的机器学习数据集的一部分,它为卫生经济与贫困交叉领域的研究提供了标准化、可复现的数据基础,对全球健康公平性分析及政策评估具有重要推动作用。
当前挑战
该数据集所解决的领域核心挑战在于量化卫生支出对贫困的催化作用,尤其是在非洲高度脆弱的卫生融资体系中,医疗自付支出常使家庭陷入或加深贫困。构建过程中面临的挑战包括:数据来源的时空异质性,需整合39个国家、跨度35年的观测条目,并处理因统计方法、货币购买力差异造成的可比性难题;缺失值与置信区间的不完整性,部分观测缺乏高/低置信区间界限,给不确定性建模带来障碍;多维分层结构(如城乡、性别)要求研究者精细过滤,以免聚合偏误影响因果推断的稳健性。
常用场景
经典使用场景
该数据集作为世界卫生组织全球卫生观察站的核心指标之一,被广泛应用于卫生经济学与贫困研究的交叉领域。其最经典的用途在于量化家庭卫生支出对贫困发生率的影响,即评估因自付医疗费用而跌入国际贫困线(日均1.90美元)以下的人口比例。研究者通常利用该数据集进行跨国面板数据分析,通过构建回归模型或描述性统计,揭示不同非洲国家在卫生筹资公平性上的差异。此外,该数据常与宏观卫生支出、医保覆盖率等指标联合使用,以剖析卫生系统脆弱性与贫困陷阱之间的动态关联。数据集中提供的城乡分层变量(RESIDENCEAREATYPE)使得深入分析卫生支出致贫效应的空间异质性成为可能,为精准施策提供了证据基础。
衍生相关工作
该数据集的发布催生了一系列具有深远影响的衍生性学术工作。最典型的是卫生筹资公平性指数(如 Kakwani 指数再分配效应)的跨国产出与验证研究,学者们利用该数据作为因变量,考察税收累进性、社会健康保险覆盖率等自变量对贫困化率的影响机制。同时,基于该面板数据,研究者构建了预测模型——采用诸如广义线性混合模型或机器学习方法,模拟不同政策情境(如取消门诊自付、提高基本药物报销比例)下贫困率的反事实走势,这类工作为前瞻性卫生政策评估奠定了方法学标杆。此外,该数据促进了时空统计方法的创新,例如应用贝叶斯时空模型填补非洲国家间的数据缺失值,进而生成连续年份、全大陆尺度的卫生致贫风险地图,这些成果为资源优先配置提供了视觉化决策支持。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区因家庭医疗支出而被推至每日1.90美元贫困线以下的人口比例,是评估全民健康覆盖(UHC)财务保护维度的关键指标。当前前沿研究正利用此类数据,结合机器学习与时空建模,解析医疗支出致贫的深层机制及其与流行病学转型、气候变化冲击的交互效应。后疫情时代,随着全球对卫生系统韧性与公平性的反思加深,该数据为量化灾难性医疗支出对脆弱群体的影响提供了实证基础,尤其在撒哈拉以南非洲,其成果正为世界银行与WHO联合推动的‘财务保护指数’更新提供数据驱动洞察,助力制定精准的健康筹资干预策略。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务