five

electricsheepafrica/africa-who-population-pushed-below-the-365-a-day-poverty-line-by

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-pushed-below-the-365-a-day-poverty-line-by
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在1985年至2019年间,因家庭医疗支出而被推至每日3.65美元贫困线以下的人口比例的观测数据。数据集来源于WHO Global Health Observatory,并经过重新打包为Parquet格式,包含国家代码、年份、数值估计值、置信区间等信息。数据覆盖41个非洲国家,共295条记录。数据集还包括居住地区类型(农村、城市、全国)等子维度。

This dataset contains country-level observations for the WHO GHO indicator "Population pushed below the $3.65 a day poverty line by household health expenditures (%, national, rural, urban)" (`FINPROTECTION_IMP_NP365_POP`) across African nations, spanning 1985–2019. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在非洲大陆,因家庭医疗支出而跌至每日3.65美元贫困线以下的人口比例,是衡量医疗保障公平性的关键指标。该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,经由系统化采集与整合,构建为易于机器学习使用的Parquet格式文件。数据覆盖1985年至2019年间41个非洲国家的295条观测记录,严格提取原始API中的浮点精度数值字段,并完整保留了可用的置信区间上下界信息。每条记录按国家、年份及居住地类型(全国、农村、城市)三个维度进行结构化组织,形成统一且规范的数据模式。
使用方法
该数据集的使用极为便捷,可通过HuggingFace Datasets库直接加载。用户只需调用`load_dataset("electricsheepafrica/africa-who-population-pushed-below-the-365-a-day-poverty-line-by")`即可获取训练数据,并利用`to_pandas()`方法转换为Pandas DataFrame进行进一步分析。典型操作包括:通过筛选`dim1`字段过滤特定居住地类型(如以`_BTSX`结尾的值表示两性合计),或按`country_iso3`字段提取单一国家的时间序列数据。此外,数据集中包含的`value_low`与`value_high`字段可用于构建误差棒或进行不确定性建模,而时间戳字段`last_updated`则便于追溯数据版本。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)创建,经Electric Sheep Africa团队整理后于2023年发布,聚焦于非洲地区因家庭卫生支出而跌入日均3.65美元贫困线以下的人口比例(涵盖国家、农村及城市层面)。核心研究问题在于量化医疗费用对非洲居民经济安全的影响,揭示卫生筹资不公引发的致贫效应。作为首个统一、机器学习就绪的非洲健康经济数据集,它填补了区域级精细指标的空白,为政策制定者与研究者评估全民健康覆盖进展提供了关键工具,对推动非洲卫生经济学实证分析具有里程碑意义。
当前挑战
当前挑战包括三方面:一是领域问题层面,需解决医疗支出致贫率的跨时空可比性——数据涵盖1985至2019年,但国家间统计口径、通胀调整方法及贫困线标准差异显著,导致模型推断易受时间与地域偏差干扰;二是构建过程中,原始WHO API数据存在缺失值(如置信区间仅部分记录)、维度编码复杂(需区分性别与居住类型分层),清洗时需权衡插补精度与信息损失;三是样本量仅295行,稀疏性限制了深度学习方法的应用,且多数国家年度观测不连续,给时序建模与泛化带来严峻考验。
常用场景
经典使用场景
该数据集的核心应用场景在于量化评估非洲国家因家庭卫生支出而陷入极端贫困的人口比例,以日均3.65美元的国际贫困线为基准。研究者可借助这一面板数据,分析不同国家、城乡区域及时间维度下健康支出对贫困深化的冲击程度,进而构建回归模型或分类任务,识别卫生筹资脆弱性最高的群体与地域。作为WHO全球卫生观察站提供的标准化指标,该数据集尤其适合用于跨国比较研究,揭示卫生系统财务保护水平的时空演变规律。
解决学术问题
该数据集直接回应了卫生经济学与全球健康领域的关键学术命题——如何实证衡量‘灾难性卫生支出’所引发的贫困加剧效应。长期以来,非洲地区因数据碎片化而难以系统评估健康筹资的社会经济后果,该数据集通过统一的指标定义和长达三十余年的时序覆盖,填补了低收入国家卫生财务风险定量研究的空白。其分层统计(全国/农村/城市)更支持探讨城乡卫生筹资公平性、贫困陷阱的跨国驱动因素等前沿议题,为全民健康覆盖(UHC)监测提供了不可替代的实证基础。
实际应用
在实际政策层面,该数据集可被各国卫生部门、国际发展机构及非政府组织用于诊断卫生筹资体系的薄弱环节,并指导精准干预。例如,识别出农村地区因自付医疗费用而跌至贫困线以下的人口比例较高时,可推动针对性扩大医疗保险覆盖或强化初级卫生保健服务。此外,世界卫生组织与非洲疾控中心可基于此数据定期发布区域卫生财务保护报告,监测可持续发展目标(SDG 3.8.2)中关于财务风险保护的进展,为资源分配与改革优先级设定提供数据驱动的决策依据。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区因家庭卫生支出而陷入每日3.65美元贫困线以下的人口比例,是健康公平与贫困交叉研究的前沿工具。借助世界卫生组织全球卫生观察站(WHO GHO)的权威数据,该数据集为评估全民健康覆盖(UHC)进展中的灾难性卫生支出影响提供了关键指标,尤其在后疫情时代非洲卫生系统脆弱性凸显的背景下,其价值愈发显著。当前研究热点集中于利用机器学习和时间序列分析,揭示不同国家、城乡区域间卫生筹资保护不足的空间异质性,从而为政策制定者优化健康保险设计与减贫策略提供数据驱动的实证依据。该数据集的发布填补了非洲地区健康经济微观层面系统性数据的空白,有力推动了可持续发展目标(SDG 3.8.2)相关研究的纵深发展。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务