electricsheepafrica/africa-who-average-of-13-international-health-regulations-core-sdgihr2018
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-average-of-13-international-health-regulations-core-sdgihr2018
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2018-2020年间关于WHO GHO指标13项国际卫生条例核心能力得分的平均值,SPAR版本,第一版(SDGIHR2018)的国家级观察数据。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察站OData API,并以Parquet文件格式重新打包,所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Average of 13 International Health Regulations core capacity scores, SPAR version, 1st edition (SDGIHR2018) across African nations, spanning 2018–2020. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区,收录了2018至2020年间47个非洲国家在国际卫生条例核心能力评分方面的平均值(指标代码SDGIHR2018)。数据经过精心重构,以Parquet格式存储,并统一了模式结构。所有数值均取自原始数据中的浮点精度字段(NumericValue),而非用于展示的字符串,同时包含了置信区间上下界(value_low, value_high)等补充信息,确保了数据的精确性和可用性。
特点
该数据集最显著的特点是其专为机器学习任务设计的整洁性与一致性。数据集包含141条记录,每个国家每年对应一个观测值,无子维度分层,简化了分析流程。其字段设计明确区分了点估计值、置信区间、展示字符串及国家、年份等元信息,为分类与回归任务提供了良好的基础。此外,数据遵循CC BY 4.0许可协议,确保了开放获取与合规使用。
使用方法
使用该数据集非常便捷,可通过HuggingFace的datasets库直接加载为数据集对象,并轻松转换为Pandas DataFrame进行深入分析。用户可按需过滤出“两性合计”或特定国家的观测值,例如利用dim1字段筛选全国层面的数据,或根据country_iso3列提取单个国家的时间序列。该数据集适用于训练预测非洲各国卫生法规核心能力的机器学习模型,进行趋势分析或区域比较研究。
背景与挑战
背景概述
在全球公共卫生治理体系中,国际卫生条例(IHR)核心能力评分是衡量各国应对突发公共卫生事件能力的关键指标。该数据集由Electric Sheep Africa团队于2020年整理发布,源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据API,聚焦于非洲47国在2018至2020年间13项IHR核心能力得分的均值(SPAR版本,第一版)。其核心研究问题在于通过标准化、机器可读的格式,量化非洲大陆各国在传染病监测、应急响应、实验室能力等维度上的整体水平,为区域健康安全评估与跨国比较提供可靠数据支撑。作为首个针对非洲地区IHR核心能力的高质量数据集,它填补了该区域在结构化健康指标体系上的空白,有力推动了基于数据驱动的非洲公共卫生决策与机器学习建模研究。
当前挑战
该数据集所解决的领域挑战在于:非洲大陆长期缺乏一致、可比的IHR核心能力量化数据,致使全球健康安全评估中非洲区域存在认知盲区,进而影响国际资源分配与跨境疫情协同防控。数据集构建过程中面临多重困难:首先,从WHO GHO原始API中提取数据时需处理异构字段与缺失置信区间,确保数值型字段(NumericValue)的精确转换而非格式字符串;其次,需对47个国家的三年观测数据进行统一清洗,消除因国家报告周期差异导致的时间序列不连续性;此外,面对亚维度(如性别、居住地类型)的复杂分层结构,设计既保留原始分类信息又适于机器学习的扁平化压缩方案,成为数据建模前的一大技术挑战。
常用场景
经典使用场景
该数据集汇聚了非洲47个国家于2018至2020年间,依据《国际卫生条例》核心能力评分框架(SPAR版本)计算得出的13项指标均值,由世界卫生组织全球卫生观察站官方发布。作为面向机器学习的整洁化时序面板数据,它典型地被应用于跨国卫生系统韧性的量化评估、区域卫生安全能力的纵向比较,以及预测建模中目标变量的构造,是分析非洲大陆公共卫生治理成效的关键数据基石。
实际应用
在实际应用场景中,该数据集直接服务于非洲各国卫生部的政策监测与规划优化,帮助决策者追踪本国卫生应急能力的年度变化趋势,对标区域平均水平。同时,它为世界卫生组织及非洲疾病预防控制中心等区域机构提供了数据驱动的资源配置依据,助力识别能力薄弱的国家并优先部署技术援助。此外,该数据还可嵌入全球卫生安全指数等可视化仪表盘,成为国际发展机构评估投资成效的重要参考。
衍生相关工作
围绕该数据集衍生了多项具有影响力的学术工作,包括基于该指标构建非洲卫生安全能力的时空演化图谱,揭示冲突、气候与疫情对核心能力的非线性冲击;也有研究将其作为结果变量,量化《国际卫生条例》缔约国报告机制对能力提升的真实贡献。更有学者利用其置信区间信息,开发了适应小样本非洲国情的贝叶斯预测模型,显著提升了低资源环境下卫生安全风险预警的稳健性。
以上内容由遇见数据集搜集并总结生成



