five

electricsheepafrica/africa-who-population-with-household-spending-on-health-greater-than-tatot25pop

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-population-with-household-spending-on-health-greater-than-tatot25pop
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在1985-2021年间,家庭医疗支出超过总预算25%的人口比例(WHO GHO指标FINPROTECTION_CATA_TOT_25_POP)的国家级观测数据。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有数值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。这是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator "Population with household spending on health greater than 25% of total household budget (SDG 3.8.2, reported data) (%)" (`FINPROTECTION_CATA_TOT_25_POP`) across African nations, spanning 1985–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集聚焦于衡量非洲国家人口中家庭卫生支出超过家庭总预算25%的比例,作为可持续发展目标3.8.2的监测指标。数据源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,经过系统化提取与重构,以Parquet格式封装,并遵循一致的架构标准。所有数值均采用浮点精度的`NumericValue`字段,而非显示字符串,确保分析的精确性。数据集覆盖1985至2021年间44个非洲国家的358条观测记录,按国家、年份及亚维度(如城乡类型)进行分层,每条记录均包含点估计值及置信区间上下限,便于科学评估与建模。
使用方法
用户可通过HuggingFace的`datasets`库便捷加载该数据集,例如使用`load_dataset`函数直接获取训练集,并转换为Pandas DataFrame进行后续处理。为聚焦于全国性、不分性别的观测,可依据`dim1`字段筛选以`_BTSX`结尾或空值的行。对于单一国家的时间序列分析,可按`country_iso3`字段过滤并依`year`排序。数据集的列结构包含分类(如指标代码、区域)和数值特征,适合直接应用于监督学习模型,或作为特征工程与探索性数据分析的基础数据源。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)于2021年发布,经由Electric Sheep Africa团队重新整理打包,聚焦于非洲地区家庭卫生支出占家庭总预算超过25%的人口比例(可持续发展目标3.8.2指标)。这一指标精准刻画了灾难性卫生支出对居民经济安全的冲击,是评估全民健康覆盖(UHC)进程的关键维度。数据集覆盖44个非洲国家1985至2021年的观测,包含点估计与置信区间,为机器学习模型提供了结构化、可复用的健康经济定量资料,在政策制定、流行病学建模及跨国比较研究中具有重要参考价值。
当前挑战
该数据集所应对的领域挑战在于,灾难性卫生支出数据长期缺乏非洲大陆的高时效性标准化记录,导致对撒哈拉以南区域健康保障风险的系统性评估受阻。构建过程中,原始数据以分层维度(如城乡、性别)呈现,伴随不一致的记录格式与缺失的置信区间,需要整合为统一Parquet架构并保留层间差异。此外,少量样本(358行)与现代数据驱动模型的需求相悖,要求构建者精心设计特征工程与分层策略,以在稀疏数据中提取稳健的预测信号,同时避免样本偏倚带来的泛化风险。
常用场景
经典使用场景
该数据集聚焦于非洲国家家庭卫生支出占总预算比例超过25%的人口比例,是监测可持续发展目标3.8.2(避免因医疗支出导致经济灾难)的核心指标。经典使用场景包括跨国时间序列分析,研究者可据此刻画非洲各国在1985至2021年间因医疗负担致贫风险的演变轨迹,识别高风险群体(如农村与城市差异),并评估卫生政策干预对家庭经济保护的效果。
解决学术问题
该数据集有效解决了非洲区域卫生支出数据碎片化与不可比的问题,为卫生经济学研究提供了标准化、可复用的面板数据。学术上,它助力于验证灾难性卫生支出(CHE)的分布规律、贫困陷阱机制以及全民健康覆盖(UHC)推进中的区域不平等议题,其置信区间字段更为不确定性量化提供了基础,提升了统计推断的可靠性。
实际应用
实际应用中,该数据集支持世界卫生组织及各国卫生部进行卫生筹资绩效评估,辅助制定分级医疗补贴策略与财政保护阈值。非政府组织可利用其定位高财务脆弱性国家,优化人道援助资源配置;金融科技公司亦可结合消费数据建模,设计针对低收入家庭的健康保险产品,降低因病返贫风险。
数据集最近研究
最新研究方向
在非洲健康经济学领域中,该数据集聚焦于灾难性医疗卫生支出(即家庭卫生支出占总预算比例超过25%)的监测与预测,紧密关联联合国可持续发展目标3.8.2。基于1985至2021年间44个非洲国家的时空面板数据,当前前沿研究方向包括:一、利用机器学习模型识别贫困脆弱性与卫生筹资风险之间的非线性关联,揭示极端支出事件的地理与人口分层模式;二、结合COVID-19疫情等公共卫生危机冲击,量化突发健康事件对家庭经济韧性的纵向影响;三、通过置信区间数据增强鲁棒性预测,为WHO等机构制定区域差异化医疗保险与财政保护政策提供数据驱动依据。该数据集系统性能重构非洲卫生筹资不平等图景,对全球健康治理与抗贫困战略优化具有范式革新意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务