electricsheepafrica/africa-who-availability-of-estimates-on-impoverishment-due-to-out-of

Name: electricsheepafrica/africa-who-availability-of-estimates-on-impoverishment-due-to-out-of
Creator: electricsheepafrica
Published: 2026-05-02 00:46:18
License: 暂无描述

Hugging Face2026-05-02 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/electricsheepafrica/africa-who-availability-of-estimates-on-impoverishment-due-to-out-of

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含非洲国家在1991年至2014年间，世界卫生组织全球健康观察指标因自付医疗费用而导致贫困的估计数据的可用性（FINPROTECTION_IMPOV_ESTIMATE_AVAILABLE）的国家级观察数据。数据来源于WHO Global Health Observatory的OData API，并重新打包为Parquet格式文件，包含国家代码、年份、数值估计值、置信区间等信息。数据集覆盖36个非洲国家，共71行数据。

This dataset contains country-level observations for the WHO GHO indicator Availability of estimates on impoverishment due to out-of-pocket health expenditures (FINPROTECTION_IMPOV_ESTIMATE_AVAILABLE) across African nations, spanning 1991–2014. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. The dataset covers 36 African nations with a total of 71 rows.

提供机构：

electricsheepafrica

搜集汇总

数据集介绍

构建方式

本数据集源自世界卫生组织全球卫生观察站（WHO GHO）的OData API，聚焦于非洲国家因自付医疗支出而陷入贫困的估计可用性指标（FINPROTECTION_IMPOV_ESTIMATE_AVAILABLE）。数据经过重新打包，以Parquet格式存储，并采用统一的模式结构。所有数值均直接取自原始API中的浮点精度字段NumericValue，同时包含可用的置信区间上下界。数据集限定于WHO非洲区域（ParentLocationCode = 'AFR'）的36个国家，时间跨度为1991年至2014年，共计71条观测记录。每个观测条目对应一个国家与年份的组合，无额外子维度分层。

使用方法

用户可通过HuggingFace的datasets库直接加载该数据集，使用load_dataset函数即可获得包含71条记录的训练集，并可轻松转换为Pandas DataFrame进行后续分析。典型使用方法包括过滤出全国层面且两性通用的数据行，或针对特定国家（如肯尼亚）按年份排序提取时间序列。数据集模式中包含indicator_code、country_iso3、year等多个关键字段，便于进行按指标、国家或年份的筛选与聚合操作。由于数据为表格形式，既适用于分类任务也适用于回归任务，可直接用于机器学习模型的训练与评估。

背景与挑战

背景概述

在全球健康治理领域，因自付医疗支出导致的家庭贫困是衡量卫生系统财务风险保护能力的关键指标。世界卫生组织（WHO）全球卫生观察站（GHO）自1991年起系统收集非洲国家因自付医疗费用陷入贫困的估计可用性数据，旨在揭示该地区卫生筹资体系的脆弱性。该数据集由Electric Sheep Africa团队于2024年基于WHO官方OData API重新整合发布，覆盖36个非洲国家1991至2014年间的71条观测记录，为研究非洲卫生支出导致的灾难性支出与贫困陷阱提供了标准化、机器学习就绪的数值型数据。作为首个专门聚焦非洲大陆卫生财务保护估算可用性的结构化数据集，它填补了该区域健康经济学建模中数据碎片化与格式不一致的空白，推动国际卫生政策分析与预测建模的发展。

当前挑战

该数据集所应对的核心领域挑战在于，非洲国家普遍缺乏对因自付医疗支出致贫程度的系统性估算，导致政策制定者难以评估卫生筹资公平性与社会安全网的有效性。传统上，贫困估算依赖于人口调查，但数据采集滞后、国别定义差异及跨年份可比性缺失，使得纵向分析与跨国比较困难重重。在构建过程中，团队面临从WHO异构OData接口中过滤仅非洲区域（AFR）数据、处理置信区间缺失值、统一《NumericValue》而非显示字段的数值精度等工程难题。此外，71条仅有36国的时间序列极其稀疏，且无次级维度分层（如性别、城乡），限制了亚组分析的深度，凸显了在非洲卫生数据生态中构建高质量、可交互数据集的艰巨性。

常用场景

经典使用场景

该数据集的核心用途在于评估非洲国家因自付医疗支出导致的贫困发生率，为全球健康经济学研究提供关键指标。研究者可借助该数据构建时间序列模型，追踪1991至2014年间36个非洲国家在医疗保障财务风险保护方面的动态变化，尤其适用于分析医疗支出对家庭经济状况的冲击强度。数据集的标准化结构使其可直接用于分类或回归任务，例如预测特定国家或年份的贫困估计可用性状态，或量化医疗负担与宏观经济指标之间的关联。

解决学术问题

该数据集直面全球健康领域的关键学术难题：如何系统量化自付医疗支出对贫困的加剧效应，尤其是在数据稀缺的非洲地区。它填补了WHO全球健康观测站中关于‘财务保护’指标的空白，使研究者能够突破传统单一年份横截面分析的局限，开展跨国纵向比较研究。通过揭示估计数据的可用性模式，该数据集助力学术界识别数据收集的薄弱环节，推动更精准的贫困测量方法论发展，并为实现全民健康覆盖（UHC）的全球目标提供实证基础。

实际应用

在实际应用中，该数据集为非洲各国卫生政策制定者与公共卫生机构提供了可操作的决策依据。通过分析哪些国家或年份缺乏贫困估计数据，政策制定者可优先调配资源以填补证据缺口，从而设计更具靶向性的医疗保障方案。国际发展组织可借此评估医疗金融保护项目的实施效果，例如对比实施医疗救助计划前后贫困发生率的变化趋势。此外，数据与机器学习模型的结合，能够帮助预测医疗支出风险较高的社区，为精准干预提供数据支持。

数据集最近研究