electricsheepafrica/africa-who-international-health-regulations-core-capacity-scores
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-international-health-regulations-core-capacity-scores
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2021年至2024年期间的WHO GHO指标国际卫生条例核心能力评分,SPAR版本,第二版(SDGIHR2021)的国家级观测数据。它是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而不是显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了47个非洲国家,总共有188行数据,并且仅限于WHO AFRO地区(ParentLocationCode = AFR)。数据集的结构包括多个列,如indicator_code、country_iso3、year、value_numeric等,用于存储不同类型的观测数据。
This dataset contains country-level observations for the WHO GHO indicator International Health Regulations core capacity scores, SPAR version, 2nd edition (SDGIHR2021) across African nations, spanning 2021–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 188 rows and is limited to the WHO AFRO region (ParentLocationCode = AFR). The dataset schema includes columns such as indicator_code, country_iso3, year, value_numeric, etc., for storing various types of observational data.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区《国际卫生条例》核心能力评分指标(SDGIHR2021),采用SPAR第二版标准。原始数据经系统化清洗与重组,统一转换为Parquet格式,并保持一致的列式架构。数据提取严格依据浮点精度的NumericValue字段,而非展示字符串,同时保留可用的置信区间上下界值(value_low, value_high)。数据集覆盖2021至2024年间47个非洲国家,共188条观测记录,每条记录对应特定国家与年份的单一评分,无子维度划分。
使用方法
使用者可借助HuggingFace的datasets库直接加载数据,通过load_dataset函数获取训练集并转换为Pandas DataFrame格式进行分析。若要聚焦于国家级总体评分,可依据dim1字段中是否包含_SEX_BTSX后缀或缺失值进行过滤。针对特定国家的时间序列研究,可基于country_iso3列筛选,并按年份排序。数据集默认不进行额外预处理,所有评分以浮点数形式直接呈现,适合直接输入预测模型或进行统计描述与可视化分析。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2024年从世界卫生组织全球卫生观察站(WHO GHO)OData API中提取并重新封装,聚焦于非洲47个国家在2021至2024年间《国际卫生条例》核心能力评分(SPAR版本第二版,指标代码SDGIHR2021)。核心研究问题在于量化评估非洲各国在应对公共卫生紧急事件时的基础监测、响应与核心能力水平,为全球卫生安全与可持续发展目标(SDG)相关指标提供结构化、机器可读的时序数据。作为首个面向非洲大陆统一整理的WHO GHO指标集合,该数据集填补了该区域高质量、标准化卫生能力时空数据的空白,对推动区域公共卫生政策分析、流行病学建模及机器学习应用具有重要基础性作用。
当前挑战
该数据集所解决的领域问题核心挑战在于:非洲各国在国际卫生法规核心能力评估中缺乏统一、持续且易于机器处理的数据来源,传统数据分散于WHO报告与PDF文档中,难以支撑大规模定量分析、时间序列建模与跨国产出对比。构建过程中主要挑战包括:从庞杂的WHO GHO OData接口中筛选并验证非洲区域数据,确保47国跨年度的指标完整性与数值精度;处理原始数据中置信区间缺失(value_low/value_high部分记录不可用)及维度字段(dim1/dim2)的一致性对齐问题;将不同来源的字符串表示(value_display)与浮点数值(value_numeric)精准映射至统一Parquet模式,最终生成仅有188条记录的小样本数据集,这对机器学习模型在有限样本下的泛化能力提出了额外挑战。
常用场景
经典使用场景
在公共健康监测的宏大叙事中,追踪各国对《国际卫生条例》核心能力的履约状况是评估全球卫生安全韧性的关键环节。该数据集最经典的使用场景在于构建横跨2021至2024年、覆盖47个非洲国家的纵向面板数据,进而开展跨国比较与时间序列分析。研究者可借此剖析特定国家在疾病监测、应急响应、实验室能力等核心维度的能力演变轨迹,或借助SPAR(自评年度报告)版本评分中的置信区间,评估评估的不确定性。数据以机器学习的友好格式呈现,便于直接加载为数据框并依据性别或城乡等维度进行筛选,为量化非洲大陆卫生系统核心能力的现状与动态提供了坚实的数据基石。
解决学术问题
在学术研究的深水区,该数据集精准回应了全球健康治理中的一项紧迫难题:如何系统性地量化并比较中低收入国家,尤其是非洲地区,在国际卫生法规核心能力建设上的真实进展。传统上,此类评估常受限于数据碎片化、标准不一及时间跨度不足。此数据集通过统一抽取WHO全球卫生观测站的官方数值型指标,并整合200余条由国家与年份组合而成的观测记录,解决了标准化数据匮乏的学术痛点。它使得学者能够跨越单一国家的局限,检验卫生系统能力与疾病暴发响应效能之间的统计关联,或探索国际援助、政策变迁对能力提升的因果效应,从而为完善全球卫生安全架构提供循证依据。
实际应用
在现实世界的应用图景中,该数据集远非静止的数字集合,而是驱动全球健康决策的关键引擎。公共卫生机构与国际组织,如非洲疾控中心或WHO区域办事处,可借助这一数据源快速生成区域核心能力的热点地图,识别出能力薄弱的国家或特定维度,从而精准调配资源与技术支持。对于非政府组织而言,该数据集可作为评估项目成效的循证基线,例如对比某国在《国际卫生条例》能力建设干预前后的评分变化。更长远来看,这些数据能为机器学习模型提供训练燃料,用于预测未来可能发生的公共卫生突发事件风险等级,实现从被动响应向主动预警的策略转型,切实增强非洲大陆的健康安全保障。
数据集最近研究
最新研究方向
该数据集聚焦非洲国家《国际卫生条例》核心能力评分的时空动态演变与预测建模,是后疫情时代全球卫生安全评估的前沿阵地。关联2024年世界卫生大会通过的《大流行病协议》修正案,研究者正借助此数据构建机器学习回归模型,以量化2021至2024年间47个非洲国家在突发公共卫生事件应对中的脆弱性与韧性。这一方向不仅为资源匮乏地区优化卫生系统投资提供了数据驱动的决策锚点,更通过置信区间信息的纳入推动了不确定性感知的智能预警系统发展,对实现非洲大陆卫生安全的精细化治理具有里程碑意义。
以上内容由遇见数据集搜集并总结生成



