electricsheepafrica/africa-who-policy
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-policy
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2021年至2023年期间,关于实施国际卫生条例的政策、法律和规范性工具(IHRSPAR2_C01)的国家级观测数据。数据来源于世界卫生组织全球健康观察站OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。
This dataset contains country-level observations for the WHO GHO indicator Policy, Legal and normative Instruments to implement IHR (IHRSPAR2_C01) across African nations, spanning 2021–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观测站的OData API,聚焦于非洲国家在2019年《国际卫生条例》实施中的政策、法律与规范性工具指标(代码IHRSPAR2_C01)。数据经过精心抽提与重整,以Parquet文件格式封装,并统一架构。所有数值均采用浮点精度的NumericValue字段,而非显示字符串,确保了机器学习任务的直接可用性。若置信区间可用,则同时纳入value_low与value_high字段。数据集覆盖2021至2023年间47个非洲国家的141条观测记录,通过WHO AFRO区域代码(ParentLocationCode = 'AFR')进行筛选,构建起一个轻量而聚焦的非洲卫生政策时间序列集合。
特点
本数据集的核心特色在于其简洁且标准化的结构,专为机器学习场景设计。每个国家-年份组合仅对应单一数值,无额外子维度,避免了因性别或地区分层带来的复杂解析。指标类型为表格分类与回归,可直接作为监督学习的目标变量。所有列包括指示代码、国家ISO3代码、WHO区域、年份、数值点估计、置信区间上下界以及显示字符串,并附有数据更新日期,便于追踪数据时效性。此外,数据集隶属于Electric Sheep Africa集合,旨在打造统一的非洲数据仓库,提升了跨数据集的可复现性与互操作性。
使用方法
使用该数据集极为便捷,通过HuggingFace的datasets库即可加载。用户可调用load_dataset('electricsheepafrica/africa-who-policy')获取数据,并转换为Pandas DataFrame进行后续分析。若需聚焦于全国水平且两性混合的数据,可通过检测dim1字段是否以'_BTSX'结尾或为空值进行筛选。对于时间序列分析,可按country_iso3列过滤特定国家(如'KEN'代表肯尼亚),并依年份排序。该数据集不仅支持分类与回归建模,还可作为非洲卫生政策效能量化评估的基准资源。
背景与挑战
背景概述
在全球公共卫生治理体系日趋完善的背景下,世界卫生组织全球卫生观测站(WHO GHO)持续监测各国对于《国际卫生条例(2005)》核心能力的落实进展。该数据集由Electric Sheep Africa团队于2023年整理并发布,聚焦非洲区域47个国家在2021至2023年间关于“执行IHR的政策、法律与规范性工具”这一关键指标(IHRSPAR2_C01)的国家级观测数据。作为首个面向机器学习友好型的非洲卫生政策数据集,它将来自WHO官方OData API的结构化数据重新封装为统一的Parquet格式,显著降低了研究者获取与分析非洲区域卫生治理数据的门槛。该数据集不仅为评估各国法律框架与公共卫生应急能力的匹配程度提供了量化依据,也推动了数据驱动下的全球健康安全研究范式变革,成为健康政策分析、公共治理评估及国际发展研究等领域的重要资源。
当前挑战
该数据集面临的核心领域挑战在于:非洲多国法律与政策层面的IHR实施状况长期缺乏标准化、可机读的量化指标,致使跨国比较与趋势分析困难重重。构建过程中,主要挑战集中于:其一,原始WHO GHO数据格式异构,存在数值字段与显示字符串混淆的问题,必须严格提取浮点型数值并清理缺失值与异常值;其二,观察样本仅141条,且时间跨度较短(2021–2023),导致模型训练易陷入过拟合,难以捕捉长期政策变迁与制度效能;其三,部分国家在某些年份数据缺失,限制了完整面板分析的可行性,需设计鲁棒的插值与降维策略以应对稀疏性;此外,数据按国家层级聚合,缺乏亚国家级或人口子群维度,难以剖析政策落实的内部异质性。
常用场景
经典使用场景
该数据集汇聚了非洲47个国家在2021至2023年间关于《国际卫生条例》实施所需的政策、法律与规范性工具(IHRSPAR2_C01)的量化评估数据。其核心使用场景在于支持跨国比较和时间序列分析,研究者可借此剖析非洲各国在卫生法规框架建设上的阶段性成就与差距。借助统一的数据架构和置信区间信息,该数据集为训练回归或分类模型提供了坚实基石,尤其适用于评估公共卫生治理水平与疫情应对准备度之间的关系。
衍生相关工作
该数据集衍生出的一系列经典工作主要集中在健康治理建模与数据整合领域。研究人员已将其与WHO GHO框架下的其他指标(如检测能力、应急融资)进行关联分析,构建综合性的卫生安全指数。另有工作利用该数据训练时序预测模型,预估未来三年内非洲各国政策完善度的演变轨迹。部分学者还将其作为基准数据集,验证针对小样本区域数据的可迁移学习算法。此外,Electric Sheep Africa项目以此为基础,推动了更多非洲健康指标的统一封装与机器学习互操作标准的确立。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家在《国际卫生条例》实施过程中所制定的政策、法律及规范性工具的评估与监测,是当前全球卫生安全领域的前沿研究方向。结合非洲大陆在全球公共卫生治理中的脆弱性与新冠疫情后强化卫生应急能力的迫切需求,该数据集为量化分析各国在合规性、法律框架完备性及制度执行力上的进展提供了关键数据支撑。其涵盖2021至2023年的47国观测数据,有助于追踪非洲区域在WHO《国际卫生条例》核心能力建设中的动态演变,识别政策缺口与区域差异,并为机器学习驱动的卫生政策建模、合规性预测及资源优先分配研究奠定了坚实的数据基础。该数据集的发布显著推动了基于证据的非洲卫生系统韧性研究,对实现全民健康覆盖和全球卫生安全议程具有深远意义。
以上内容由遇见数据集搜集并总结生成



