five

electricsheepafrica/africa-who-domestic-private-health-expenditure-as-percentage-of

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-domestic-private-health-expenditure-as-percentage-of
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2023年间,WHO GHO指标“国内私人健康支出(PVT-D)占当前健康支出(CHE)的百分比”(GHED_PVT-DCHE_SHA2011)的国家级观测数据。它是Electric Sheep Africa系列的一部分——一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Domestic private health expenditure (PVT-D) as percentage of current health expenditure (CHE) (%)" (`GHED_PVT-DCHE_SHA2011`) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,聚焦于非洲地区国内私人卫生支出占当期卫生支出(CHE)的百分比这一关键指标。数据经过系统化的重封装与清洗,以Parquet格式存储,并采用统一的模式结构,确保分析就绪状态。所有数值均引自高精度的浮点字段NumericValue,舍弃冗余的显示字符串,同时保留了置信区间边界值,从而为定量分析提供了严谨可靠的数据基础。
特点
数据集覆盖了2000至2023年间47个非洲国家的1101条观测记录,时间跨度完整且地域范围广泛。作为单一维度的指标,每一条记录均对应特定国家与年份的唯一观测值,避免了分层带来的复杂性。数据集的模式设计清晰,包含指示代码、国家ISO代码、WHO区域、年份及数值字段,并附带置信区间与更新时间戳,便于研究者直接进行回归分析或分类预测。
使用方法
用户可通过HuggingFace的datasets库便捷加载该数据集,调用load_dataset函数即可获得可直接操作的训练集。借助pandas库,可将数据转换为数据帧形式,并通过条件筛选提取特定维度的子集,例如仅保留全国总体或两性混合的数据。对于时间序列分析,可按国家ISO代码分组并按年份排序,从而直观地追踪各国私人卫生支出比重的变化趋势。
背景与挑战
背景概述
在全球公共卫生治理体系中,卫生筹资结构是衡量一国健康保障能力与可持续性的核心指标之一。由世界卫生组织全球卫生观察站(WHO GHO)发布的《国内私人卫生支出占当期卫生支出百分比》数据集,由Electric Sheep Africa团队于2023年整合并重新封装,聚焦非洲47个国家的长期时间序列数据(2000–2023年)。该数据集以标准化的Parquet格式呈现,旨在支撑机器学习驱动的非洲卫生经济分析。其核心研究问题在于量化私人部门在非洲各国卫生体系中的融资角色,为政策制定者、国际组织及学术机构提供跨国家、跨年代的可比基准。该数据集的发布填补了非洲区域卫生支出结构化数据的空白,显著推动了基于数据驱动的区域健康经济学研究,并已在开源数据社区内成为验证卫生政策模型的关键资源。
当前挑战
该数据集所应对的核心领域挑战在于,非洲各国卫生体系中私人筹资路径的异质性与透明度不足,导致传统财政统计难以捕捉实际支出流向,进而影响全球卫生资源分配与政策干预的有效性。构建过程中面临多重技术难题:首先,原始数据来源于WHO的OData API,接口响应格式与字段命名差异显著,需统一抽取浮点精度的`NumericValue`而非显示字符串,避免数值偏差;其次,置信区间数据(`value_low`与`value_high`)在部分国家年份中存在缺失,对建模与不确定性量化构成障碍;再者,原始数据未提供子维度(如性别、城乡)的统一步骤,需设计严谨的过滤逻辑(如通过`dim1`的`_BTSX`后缀筛选全国总体数据)以维持样本一致性;最后,跨23年、47国的观测记录(1,101条)在时间序列对齐与异常值识别上需借助领域知识进行校验,确保最终数据集适合监督学习任务。
常用场景
经典使用场景
该数据集收录了2000至2023年间47个非洲国家的国内私人卫生支出占当期卫生支出百分比(PVT-D/CHE)的年度观测值,是进行非洲区域卫生融资结构纵向比较与跨国产出建模的经典素材。研究者常将其作为回归或分类任务的目标变量,借助国家编码、年份、置信区间等结构化字段,构建面板数据模型,以揭示私人卫生支出在非洲卫生体系中的动态演变规律及其与宏观经济、疾病负担等因素的关联。
实际应用
在实际应用层面,该数据集为国际组织、政府卫生部门以及非政府机构制定和优化卫生筹资政策提供了关键数据支撑。通过追踪各国私人卫生支出的长期趋势,政策制定者可以识别卫生资金缺口,评估公私合作伙伴关系效果,并针对性地设计干预措施以减少个人自付费用导致的灾难性卫生支出。此外,该数据也常用于构建预测模型,辅助传染病防控、妇幼健康等优先领域的资源分配决策。
衍生相关工作
围绕该数据集衍生了一系列具有影响力的工作,包括基于面板数据回归的非洲卫生支出决定因素分析、利用时间序列聚类方法识别不同卫生融资模式的同类国家群组,以及与WHO、世界银行等国际统计数据融合所构建的综合卫生账户模型。同时,Electric Sheep Africa团队以该数据为样本,探索了机器学习在卫生指标体系中的自动异常检测与缺失值插补方法,为非洲数据科学的可复现研究树立了标准范式。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务