five

electricsheepafrica/africa-who-external-health-expenditure-per-capita-in-us

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-external-health-expenditure-per-capita-in-us
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标人均外部健康支出(美元)(GHED_EXT_pc_US_SHA2011)在非洲国家层面的观测数据,时间跨度为2000年至2023年。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖了47个非洲国家,共1101行数据,区域筛选为WHO AFRO(ParentLocationCode = AFR)。数据集还包含了多个字段,如指标代码、国家ISO3代码、WHO区域代码、年份、数值估计值、置信区间边界、显示字符串、维度类型和值等。

This dataset contains country-level observations for the WHO GHO indicator External health expenditure (EXT) per capita in US$ (GHED_EXT_pc_US_SHA2011) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 1,101 rows, filtered by WHO AFRO region (ParentLocationCode = AFR). The schema includes columns such as indicator_code, country_iso3, who_region, year, value_numeric, value_low, value_high, value_display, dim1_type, dim1, dim2_type, dim2, and last_updated.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源于世界卫生组织全球卫生观察站(WHO GHO)的OData API,由Electric Sheep Africa团队系统化采集并重新封装而成。数据以Parquet格式存储,遵循统一的列式模式,确保机器学习任务的高效读取与处理。原始API中的NumericValue字段被直接提取作为主要数值观测值,同时保留置信区间上下界(value_low和value_high)以支持不确定性分析。数据集聚焦于非洲区域,依据WHO AFRO区域代码进行筛选,涵盖2000至2023年间的47个非洲国家,共计1101条记录,每条记录对应一个国家-年份组合的唯一观测值,未涉及子维度分层。
使用方法
使用该数据集十分便捷,通过HuggingFace的datasets库调用load_dataset函数即可加载。加载后,数据以DataFrame形式呈现,用户可利用pandas进行数据分析。由于数据集未包含子维度,建议直接使用'value_numeric'列作为回归或分类任务的目标变量。如需分析特定国家的时间趋势,可通过'country_iso3'字段进行筛选并按'year'排序;若希望对性别或居住地类型等维度进行探索,可借助'dim1'实现,但需注意本数据集该字段多为空值。此外,置信区间字段有助于不确定性量化任务的开展。
背景与挑战
背景概述
在非洲卫生经济领域,外部卫生支出(External Health Expenditure, EXT)作为衡量国际援助、捐赠及非政府组织对各国卫生系统资金支持的关键指标,其精准量化对制定可持续健康融资策略至关重要。世界卫生组织(WHO)通过全球卫生观察站(GHO)长期监测此指标,但原始数据存在格式不统一、粒度不足等问题。为应对这一挑战,Electric Sheep Africa研究团队于2023年基于WHO官方OData API构建了非洲外部卫生支出人均额数据集,覆盖2000至2023年间47个非洲国家的1101条观测记录。该数据集以Parquet格式封装,提供标准化模式,并包含点估计值与置信区间,旨在为机器学习驱动的非洲卫生经济预测、政策评估及资源分配优化提供高质量、便捷化的数据基础。自发布以来,该资源已成为区域卫生经济建模与数据科学交叉研究的重要支撑,显著推动了非洲卫生支出数据的可获取性与可分析性。
当前挑战
该数据集所解决的领域问题核心在于:非洲大陆长期面临卫生融资数据碎片化、口径不一及时间序列不连续的挑战,阻碍了基于证据的卫生政策制定与资源优化配置。具体而言,数据集构建过程中遭遇了多重技术困难。首先,WHO原始API返回的指标观察值中存在字符串类型与浮点型并存的情形,需要精确提取数值型字段(NumericValue)以确保机器学习目标的数值精度;其次,原始数据覆盖47个国家长达24年,但部分记录存在置信区间缺失(value_low、value_high为空),需在保持数据完整性与模型输入质量间取得平衡;此外,对于存在分层维度(如性别、居住区类型)的指标,需设计统一策略处理多维度交织带来的数据冗余与聚合问题;最后,跨数据源的时间戳不一致要求建立标准化更新时间戳机制,以保证数据集的可复现性与时效性。
常用场景
经典使用场景
该数据集以世界卫生组织全球卫生观察站(WHO GHO)为数据源,聚焦于非洲47个国家2000至2023年间人均外部卫生支出(以美元计)的年度观测值。在公共卫生与健康经济学领域,研究者常将其用于跨国比较分析,衡量不同非洲国家在依赖国际援助、捐赠或外部融资渠道上的卫生投入水平。由于数据按国家-年份结构组织,并包含置信区间信息,它特别适合用于时间序列回归、面板数据分析以及预测建模等任务,辅助揭示非洲外部卫生资金的时空演变规律。
解决学术问题
该数据集有效填补了非洲地区系统化、标准化外部卫生支出数据的空白,解决了长期以来因数据碎片化或不一致导致的跨国比较难题。学术研究中,它支撑了对卫生融资可持续性、外部援助依赖度及其对健康产出影响的实证检验。借助此数据,研究者能够量化分析外部卫生资金流入与疾病负担、医疗系统韧性之间的关联,探索卫生援助的边际收益与配置效率,进而在全球卫生治理框架下为资源分配策略提供证据基础。
实际应用
在实际应用中,该数据集是国际组织、政府卫生部门及非政府组织进行卫生政策评估与规划的重要工具。例如,世界卫生组织或非洲疾病预防控制中心可借助其监控各国外部卫生资金的动态变化,识别筹资脆弱国家并设计针对性干预方案。发展援助机构亦可用此数据评估援助项目的实际覆盖率与长期效果,优化资金拨付流程。此外,在公共卫生应急响应中,该数据有助于快速估算外部资金缺口,辅助跨国协调与资源调度决策。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家人均外部卫生支出(EXT per capita in US$)的时序变化与区域差异分析,为全球卫生经济学与公共政策研究提供了关键的纵向数据支撑。当前前沿方向包括利用机器学习模型预测非洲卫生融资缺口、探索外部援助与健康产出之间的非线性关联,以及结合气候、冲突等多源异构数据评估外部卫生支出的弹性与脆弱性。伴随着WHO对全民健康覆盖(UHC)监测指标的强化,该数据集在量化非洲卫生系统韧性与国际援助效率方面具有显著的战略意义,有助于推动数据驱动的决策优化与资源精准配置。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务