five

electricsheepafrica/africa-who-ihr-coordination

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-ihr-coordination
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2021-2023年间关于WHO GHO指标IHR协调、国家IHR联络点功能和倡导(IHRSPAR2_C02)的国家级观测数据。它是Electric Sheep Africa系列的一部分——一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,包含置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "IHR Coordination, National IHR Focal Point functions and advocacy" (`IHRSPAR2_C02`) across African nations, spanning 2021–2023. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源于世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区《国际卫生条例(IHR)》协调、国家IHR联络点职能与倡导能力评估指标(代码IHRSPAR2_C02)。数据经提取、清洗后以Parquet格式存储,仅保留浮点精度的数值字段(NumericValue)作为核心指标,同时纳入置信区间上下界(value_low、value_high),构建起一套具备一致架构的机器学习就绪数据集。覆盖2021至2023年间47个非洲国家的141条观测记录,每条代表特定国家与年份的组合,未设置子维度分层,确保了数据结构的简洁性。
特点
本数据集最显著的特征在于其精细化与一致性:所有数值均直接采纳自API提供的浮点型原始值,摒弃了显示字符串的模糊性,为回归与分类任务提供了可靠的连续变量。同时,精心保留了置信区间信息,便于不确定性建模。字段设计规范,包含统一的指示符代码、ISO国家代码、WHO区域标识及更新时间戳,支持跨数据集的无缝整合。数据集虽规模适中(n<1K),但聚焦于非洲卫生治理的关键领域,兼具地域专业性与时间序列分析潜力。
使用方法
用户可通过HuggingFace datasets库便捷加载数据,调用load_dataset函数即可获得可转换为Pandas DataFrame的Train分片。建议在分析前依据dim1字段过滤出两性合计(_BTSX)或缺失值记录,以获取国家层面完整观测。针对特定国家的时间序列分析,可通过country_iso3列筛选并依年份排序实现。该数据集即装即用,适配监督学习中的回归与分类任务,亦可用于健康指标的趋势推断与区域间比较研究。
背景与挑战
背景概述
在全球公共卫生治理框架中,国际卫生条例(IHR)核心能力建设是评估各国应对突发公共卫生事件能力的关键指标。非洲大陆由于资源分布不均、卫生系统脆弱性突出,其IHR协调能力的数据化监测与量化分析成为学术界和政策制定者关注的焦点。在此背景下,世界卫生组织全球卫生观测站(WHO GHO)于2023年发布了IHRSPAR2_C02指标数据集,该数据集由Electric Sheep Africa团队从WHO OData API中提取并重新整合,聚焦非洲47个国家在2021至2023年间国家IHR联络点职能与倡导能力的数值评估。该数据集以统一的Parquet格式呈现,为机器学习和区域健康治理研究提供了标准化、可复用的结构化数据资源,对推动非洲公共卫生应急体系的实证建模与政策评估具有开创性意义。
当前挑战
该数据集所解决的领域问题在于量化非洲国家在IHR协调能力这一抽象维度上的表现,传统评估依赖定性报告或离散级别评分,而该数据集通过连续的数值指标(NumericValue)实现了从模糊描述向可统计回归的跃迁,为健康治理领域的预测建模和政策排序提供了数据基础。然而,构建过程中面临多重挑战:其一,数据源自WHO官方API,原始多语言字段与异构编码需统一映射至ISO 3166-1 alpha-3标准国家代码,并过滤WHO AFRO区域;其二,不同年份的观测条目存在稀疏性,47国三年仅记录141行,揭示了非洲部分国家IHR数据上报的间隔性与缺失问题;其三,附带置信区间(value_low, value_high)的条目有限,在模型训练中需处理不确定行信息,增加了数据清洗的难度;其四,无子维度拆分导致单一年度值无法解构性别或城乡差异,限制了微观层面的比较分析能力。
常用场景
经典使用场景
非洲地区《国际卫生条例》协调能力的量化评估是公共卫生治理领域的核心议题。该数据集聚焦于国家《国际卫生条例》协调中心运作与倡导功能的监测,收录了2021至2023年间47个非洲国家的观测值,以国家-年份为基本分析单元,提供点估计值及置信区间。研究者通常将其作为监督学习中的回归或分类任务目标变量,例如利用历史数值构建时序预测模型,或结合社会经济、气候等多元特征开展跨国家的能力归因分析。该数据集的简洁结构化设计使其成为理解非洲卫生系统韧性的理想起点。
解决学术问题
该数据集有效回应了全球卫生治理研究中长期存在的数据碎片化与可比性不足的挑战。由于《国际卫生条例》协调能力的分项指标长期分散于多源报告,学界难以进行系统性的非洲大陆内部比较。该数据集通过标准化清洗与Parquet格式聚合,使得跨年度变异分析、区域聚类研究以及能力薄弱环节的识别成为可能。它推动了关于卫生安全投资优先序的实证讨论,尤其为检验国际援助与国内卫生基础设施间的互动效应提供了可靠的数据基础,深化了对全球健康治理机制有效性的理解。
衍生相关工作
该数据集的发布催生了一系列围绕非洲卫生系统监控能力的前沿探索。研究团队已将其与《国际卫生条例》其他核心能力指标(如实验室检测、应急准备等)融合,构建综合性的卫生安全指数,揭示不同能力维度间的协同或权衡关系。另有工作将时序变化与各国政治经济动荡事件编码对齐,量化冲突与治理断裂对卫生协调可持续性的侵蚀效应。在方法论层面,基于该数据缺失值插补效果的比较研究催生了面向低样本情境的贝叶斯层次模型改进方案,间接提升了非洲大陆稀疏观测数据的可用性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作