five

electricsheepafrica/africa-who-population-pushed-further-below-the-320-a-day-poverty-line

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-pushed-further-below-the-320-a-day-poverty-line
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在1985年至2019年间,因家庭健康支出而进一步低于每天3.20美元贫困线的人口比例(%,全国、农村、城市)的观测数据。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Population pushed further below the $3.20 a day poverty line by household health expenditures (%, national, rural, urban)" (`FINPROTECTION_IMP_P310_POP`) across African nations, spanning 1985–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦非洲地区因家庭卫生支出而进一步跌至每日3.20美元贫困线以下的人口比例(FINPROTECTION_IMP_P310_POP)。数据涵盖1985至2019年间39个非洲国家的300条观测记录,所有数值均提取自浮点精度的NumericValue字段,而非显示字符串,并纳入了置信区间边界值(value_low、value_high)。数据集由Electric Sheep Africa整理,以Parquet格式统一封装,并按居住地区类型等维度进行分层,每个国家、年份与维度的独特组合构成独立行,便于后续筛选与聚合。
特点
该数据集的核心特点在于其针对非洲地区健康支出致贫效应的精准刻画,反映了家庭卫生费用对脆弱人群经济状况的深层冲击。数据涵盖国家、农村与城市三类居住地区,包含点估计值及置信区间,为不确定性量化提供了依据。此外,数据集以机器学习就绪的格式呈现,列结构清晰,包含indicators_code、country_iso3、year及多维筛选标签(dim1、dim2),支持灵活的分层分析与跨国时间序列研究,尤其适合用于贫困与健康经济学的回归或分类任务。
使用方法
研究者可通过HuggingFace的datasets库直接加载数据集,使用load_dataset函数将其转化为Pandas DataFrame进行后续操作。例如,筛选出全国及双性别的观测结果可通过判断dim1字段是否以_BTSX结尾或为空实现。针对特定国家的时间序列分析,可结合country_iso3与year列进行排序。数据集适用于机器学习模型训练、健康经济政策评估及贫困动态监测等场景,用户还可依据WHO AFRO区域过滤条件,聚焦非洲大陆的特定子集开展深入研究。
背景与挑战
背景概述
在撒哈拉以南非洲地区,家庭医疗支出导致的贫困加剧已成为全球健康与减贫领域的核心议题。该数据集由世界卫生组织全球卫生观测站于2019年创建,并由Electric Sheep Africa团队基于开源数据重新封装,聚焦于因家庭医疗支出而进一步被推至每日3.20美元贫困线以下的人口比例。数据集涵盖1985至2019年间39个非洲国家的300条观测值,按国家、城乡及不同维度分层,旨在量化医疗支出对弱势群体的经济冲击。该数据为公共卫生政策制定者与研究者提供了宝贵的结构化资源,有助于评估全民健康覆盖进程中的财务保护成效,并对非洲健康经济学和减贫研究产生了深远影响。
当前挑战
该数据集所解决的领域问题在于,医疗支出导致的贫困深化长期缺乏精细化的跨国可比数据,尤其非洲国家数据稀疏且标准不一,使得健康财务风险的评估陷入困境。构建过程中面临的挑战包括:原始WHO数据仅提供分散的API接口,需跨国家、年份及维度(城乡、性别)整合;部分观测值置信区间缺失,影响模型不确定性估计;时间跨度长达34年,数据结构因指标更新而变动,需标准化为统一模式;此外,非洲国家统计能力差异导致数据空缺明显,如部分国家早期年份无记录,限制了时间序列分析的完备性与模型泛化能力。
常用场景
经典使用场景
在健康经济学与全球卫生治理的交叉领域中,该数据集的核心应用场景在于量化家庭医疗支出对贫困脆弱性的冲击。研究人员可借助此数据,构建面板数据模型以追踪1985至2019年间39个非洲国家中因自付医疗费用而进一步跌落至每日3.20美元贫困线以下的人口比例。其分层设计(全国、农村、城镇)允许对地域不平等进行细致剖析,而置信区间字段则支持不确定性分析,从而为政策干预的精准定位提供统计依据。
衍生相关工作
围绕该数据集衍生出一系列重要学术工作,包括构建医疗支出贫困影响指数的统计模型,以及将本数据与家庭消费调查(如LSMS)或气候数据融合的跨学科研究。部分学者还基于此数据训练了机器学习回归器,用于预测在不同经济情境下医疗支出对贫困线的推压效果,从而催生了‘健康财政脆弱性预测’这一新兴研究方向。这些工作持续丰富着全球卫生经济学的方法论工具箱。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家因家庭卫生支出而进一步跌至日均3.20美元贫困线以下的人口比例,反映了全球健康与贫困交叉领域的前沿研究方向。在联合国可持续发展目标(SDGs)背景下,尤其是目标1(无贫困)和目标3(良好健康与福祉)的推进中,这一指标揭示了灾难性卫生支出对脆弱群体的累积冲击,是衡量全民健康覆盖(UHC)公平性的关键标尺。近期热点事件包括新冠疫情暴露的非洲医疗融资体系脆弱性,以及国际社会对“卫生贫困陷阱”的再关注——即医疗开销反向加剧经济困境的恶性循环。数据覆盖1985至2019年间的39个国家,并细分国家、城乡维度,为机器学习模型预测贫困动态、评估政策干预(如减贫与医保改革)提供了结构化训练集,对推动数据驱动的非洲发展议程具有深远意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务