five

electricsheepafrica/africa-who-points-of-entry-and-border-health

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-points-of-entry-and-border-health
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2021-2023年期间的世界卫生组织全球健康观察指标入境点(PoEs)和边境卫生(IHRSPAR2_C11)的国家级观察数据。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察站的OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Points of entry (PoEs) and border health (IHRSPAR2_C11) across African nations, spanning 2021–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集围绕世界卫生组织全球卫生观测站(WHO GHO)的指标“入境口岸与边境卫生”构建,数据覆盖2021至2023年间47个非洲国家,总计141条观测记录。原始数据通过WHO GHO的OData API直接获取,并经统一架构重新封装为Parquet格式文件。构建过程中,重点保留了浮点精度的数值字段(NumericValue)作为核心指标,并整合了置信区间上下界信息,确保数据机器学习的即用性。数据筛选依据WHO AFRO区域代码(ParentLocationCode = 'AFR'),保证地域聚焦于非洲大陆。
特点
该数据集以简洁而精细的结构著称,每一条记录代表一个国家在特定年份的单一观测值,不存在多维分层变量,便于直接用于表格分类或回归任务。其模式设计清晰,包含指标代码、国家ISO代码、年份、数值估计及置信区间等核心字段,并额外提供显示格式字符串与更新时间戳,兼顾了机器可读性与人类可解释性。数据来源权威,依托WHO官方开放数据,遵循CC BY 4.0许可协议,确保了研究的合规性与可复现性。
使用方法
使用者可通过HuggingFace Datasets库便捷加载数据,指定数据集名称“electricsheepafrica/africa-who-points-of-entry-and-border-health”即可获得训练集。典型操作包括将数据转换为Pandas DataFrame进行后续分析,并依据维度字段(如dim1)过滤出全国总水平或特定性别的子集。例如,通过筛选以“_BTSX”结尾的维度值可提取两性合并的宏观数据,而按国家代码(如KEN)与年份排序则能生成单国时间序列,适用于趋势预测与比较研究。
背景与挑战
背景概述
在全球公共卫生治理体系中,跨境人员流动与口岸卫生管理是防范传染病国际传播的关键防线。世界卫生组织(WHO)通过《国际卫生条例(2005)》监测框架,要求各成员国报告口岸核心卫生能力建设情况。在此背景下,Electric Sheep Africa团队于2023年整合WHO全球卫生观察站(GHO)数据,构建了africa-who-points-of-entry-and-border-health数据集。该数据集聚焦非洲47个国家2021至2023年的口岸与边境卫生指标(代码IHRSPAR2_C11),包含141条观测记录,系统量化各国在入境点卫生检疫、应急响应等方面的能力水平。作为首个面向非洲大陆的机器学习就绪型口岸卫生数据集,它为跨境传染病风险评估、卫生系统脆弱性建模提供了标准化、可复现的数据基础,对推动非洲区域卫生安全研究具有开创性意义。
当前挑战
该数据集面临的核心挑战在于解决非洲口岸卫生能力量化评估的领域难题。一方面,非洲各国边境卫生监测体系发展不均衡,数据缺失与报告延迟普遍存在,WHO提供的聚合值虽可部分反映国家整体水平,却难以刻画内部区域性差异及动态变化,导致机器学习模型在预测疫情跨境传播风险时存在较大不确定性。另一方面,数据集构建过程中需克服多重障碍:原始OData接口数据存在架构不一致、显示字符串与数值字段混淆等问题,需要设计统一的清洗流程;47国数据的整合涉及不同编码体系(如ISO代码与WHO区域代码)的映射对齐;部分年份的置信区间字段不完整,限制了模型对估计精度进行评估的能力。这些挑战共同制约了该数据集在公共卫生预警系统中的实际应用效果。
常用场景
经典使用场景
非洲大陆作为全球公共卫生治理的关键区域,其边境卫生监测能力直接关系到传染病跨境传播的防控成效。该数据集汇聚了2021至2023年间47个非洲国家关于入境口岸与边境健康的官方统计数据,涵盖口岸卫生核心能力评估、入境筛查覆盖率及应急响应准备度等核心指标。研究者可借助其结构化字段(如年份、国家代码、数值估计及置信区间)构建面板数据模型,纵向追踪各国边境卫生治理能力的动态演化轨迹,或横向比较不同国家在《国际卫生条例》履约表现上的差异格局。数据集简洁的Schema设计使其天然适配于时序分类与回归任务,为量化评估非洲区域卫生安全韧性提供了标准化数据底座。
实际应用
在公共卫生决策支持系统中,该数据集直接服务于非洲各国口岸卫生基础设施的优先投资排序。流行病学团队可依据各国历年数值波动,识别边境监测体系的薄弱环节并制定靶向干预方案。世界卫生组织区域办事处利用其对成员国进行《国际卫生条例》核心能力达标进展的蓝本式跟踪,动态调整技术援助计划。非政府组织与国际金融机构亦借助该数据评估跨境卫生安全项目的投资回报率,例如在埃塞俄比亚、肯尼亚等交通枢纽国家优化入境热筛查设备的部署策略。此外,机器学习工程师可将其作为特征工程原料,融合气象、人口流动等多源数据,训练预测突发公共卫生事件跨境蔓延风险的概率模型。
衍生相关工作
围绕这一基础数据资产,学界已衍生出若干具有范式意义的创新工作。部分研究者将其作为核心验证集,开发了面向低资源国家的边境卫生能力预测框架,通过时序插值算法补全稀疏观测值以扩展时间覆盖维度。另有团队融合该数据集与人口迁移网络数据,构建了结合口岸健康容量与跨境流动性的新型空间传播模型,成功复现了非洲地区传染病暴发的关键传播瓶颈。基于其结构化特征,还催生了面向WHO GHO指标体系的可视化分析工具,实现了边境健康指标多维时序变化的即时交互呈现。这些衍生工作不仅深化了对非洲边境卫生治理复杂性的理解,也为全球健康数据科学领域贡献了可复用的方法论模板。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务