five

electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-mppg215std

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-mppg215std
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标因家庭健康支出导致的贫困差距增加,以2.15美元/天的贫困线为基准(%,全国、农村、城市)(FINPROTECTION_IMP_PG_215_STD)在非洲国家的国家级观测数据,时间跨度为1985年至2019年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从世界卫生组织全球健康观察OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Increase in poverty gap due to household health expenditures, expressed as a proportion of the $2.15 a-day poverty line (%, national, rural, urban)" (`FINPROTECTION_IMP_PG_215_STD`) across African nations, spanning 1985–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,经由Electric Sheep Africa项目重新整理并打包为Parquet格式的机器学习友好型数据集。其核心指标为“因家庭卫生支出导致的贫困差距增加,以2.15美元日贫困线的百分比表示”,覆盖1985年至2019年间41个非洲国家的295条观测记录。数据直接采用API返回的浮点精度字段NumericValue,而非格式化显示字符串,同时保留了置信区间上下界及按居住地类型(全国、农村、城市)分层的子维度信息,确保数据的精确性和结构性。
特点
该数据集最鲜明的特色在于其结构化分层与统一化的元数据设计。每个观测值均通过标准化的16列模式(Schema)呈现,涵盖指标编码、国家ISO代码、WHO区域、年份、数值估计、置信区间上下界及维度标签等字段。尤为突出的是,数据支持按国家、年份及子维度(如RESIDENCEAREATYPE)进行灵活筛选与聚合,便于研究者精准聚焦于全人群或特定亚群(如农村地区)的卫生经济负担评估,极大提升了跨国时序比较与机器学习建模的便利性。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据集,仅需一行代码`load_dataset("electricsheepafrica/africa-who-increase-in-poverty-gap-due-to-household-health-expenditures-mppg215std")`即可获取训练集,并转换为Pandas DataFrame进行后续分析。典型使用路径包括:利用维度过滤器(如dim1)提取全国或分性别、分居住地的子集,通过`country_iso3`与`year`列构造面板数据,或将`value_numeric`作为回归或分类任务的监督学习目标。直观的API设计使得数据清洗、子集划分与时间序列分析均能高效完成。
背景与挑战
背景概述
在全球公共卫生治理与可持续发展议程中,灾难性卫生支出与贫困陷阱的关联机制是发展经济学与健康政策研究的前沿议题。该数据集源于世界卫生组织全球卫生观察站,由Electric Sheep Africa团队重新整理并发布于HuggingFace平台,聚焦于非洲地区因家庭卫生支出导致的贫困缺口增加率,以每日2.15美元贫困线为基准进行度量。核心研究问题在于量化卫生自付费用对区域贫困深化的侵蚀效应,数据覆盖1985至2019年间41个非洲国家,包含国家总体、城乡分层的时空异质性信息。作为首个面向机器学习就绪的非洲卫生贫困数据库,其标准化架构与置信区间字段的保留,为后续利用深度学习方法追踪贫困动态、评估全民健康覆盖政策效能提供了坚实的数据基础设施。
当前挑战
该数据集所应对的领域问题核心在于:家庭卫生支出作为非预期冲击,如何精准量化其对贫困深度(贫困缺口)的边际贡献,并识别其随城乡、时间与政策情境的异质演变模式。传统统计建模常受限于稀疏时间序列与多维缺失值,致使对贫困固化的动态归因存在偏差。构建过程中,数据清洗面临跨年代、跨来源的计量单位一致性挑战,尤其是历史观测中‘数值展示字符串’与‘浮点精确值’的歧义分离;其次,由于WHO OData接口返回的置信区间并非对所有年度均完整,对缺失上下界值的保留与标记策略需谨慎设计;再者,城乡维度中的混合分层(如性别交叉变量)导致数据行非均匀分布,需在保持元数据可追溯性的前提下构建聚合策略,方能支持下游鲁棒建模。
常用场景
经典使用场景
该数据集聚焦于非洲国家因家庭医疗健康支出所引发的贫困缺口扩大现象,以每日2.15美元贫困线为基准,量化医疗支出对贫困深度的影响。其经典应用场景涵盖跨国比较与时间序列分析:研究者可借助国家层面的标准化指标,绘制非洲大陆医疗致贫的动态演化图景,尤其适用于评估不同居住区域(全国、农村、城市)的健康财务风险暴露程度。通过分层维度(如性别、居住地类型),学者能够精准识别脆弱群体,并追踪医疗支出在贫困深化中的边际贡献。
衍生相关工作
围绕该数据集衍生的经典工作集中于医疗财务保护指标体系的构建与跨国比较研究。相关学者将其与WHO全球健康观察站的其他财务保护指标(如家庭卫生支出占家庭总消费比例、灾难性卫生支出发生率等)联合分析,构建了多维度健康贫困风险评估框架。部分研究利用该数据集的时间序列特性,结合面板回归模型检验了宏观经济波动、医疗通胀与贫困缺口之间的关系。此外,该数据作为‘Electric Sheep Africa’开源社区的核心组件,推动了非洲数据驱动型健康政策的可重复研究范式,催生了多项关于撒哈拉以南非洲全民健康覆盖进展的实证评估工作。
数据集最近研究
最新研究方向
在非洲卫生健康与贫困交织的研究前沿,该数据集聚焦于因家庭医疗支出所加剧的贫困差距,以每日2.15美元贫困线为基准,量化了医疗服务可及性对贫困深化的乘数效应。当前,全球卫生公平议程正从单一的疾病负担转向灾难性医疗支出的社会经济后果,尤其是撒哈拉以南非洲地区的高额自付费用与脆弱性陷阱之间的恶性循环。该数据源整合了WHO全球卫生观察站41国、1985至2019年的分层指标,支持按城乡、性别等维度解析贫困缺口在卫生政策干预下的演变轨迹,为评估全民健康覆盖的实际效能提供了关键实证基础,并呼应了可持续发展目标中消除极端贫困与保障健康福祉的交汇命题。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务