electricsheepafrica/africa-who-hib-immunization-coverage-among-1-year-olds
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-hib-immunization-coverage-among-1-year-olds
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标1岁儿童中Hib(Hib3)免疫覆盖率(%)(`WHS4_129`)在非洲国家的国家级别观察数据,时间跨度为2000年至2024年。它是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)集合的一部分——一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,包含置信区间边界(`value_low`、`value_high`)。
This dataset contains country-level observations for the WHO GHO indicator Hib (Hib3) immunization coverage among 1-year-olds (%) (`WHS4_129`) across African nations, spanning 2000–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,聚焦于非洲地区1岁儿童中Hib(b型流感嗜血杆菌)第三剂疫苗(Hib3)的接种覆盖率。数据通过OData API直接获取,并以Parquet格式重新封装,采用统一的列式存储结构。所有数值均取自浮点精度的`NumericValue`字段,而非显示字符串,同时保留了置信区间上下限(`value_low`、`value_high`)。数据集覆盖2000至2024年间47个非洲国家的1164条观测记录,并依据WHO AFRO区域代码(`ParentLocationCode = 'AFR'`)进行筛选,确保地理范围的聚焦性与一致性。
特点
该数据集的核心特点在于其结构简洁且高度标准化,无子维度分层,每个国家与年份组合对应单一观测值,便于直接用于机器学习任务,如分类或回归建模。除点估计值(`value_numeric`)外,还提供置信区间信息,增强了数据的统计可靠性。此外,数据集包含ISO国家代码、WHO区域标签及更新时间戳等元数据,便于跨数据集整合与时间序列分析。作为Electric Sheep Africa系列的一部分,该数据集专为非洲卫生领域研究设计,具备即用性,可直接加载至Pandas DataFrame进行下游分析。
使用方法
用户可通过HuggingFace的`datasets`库轻松加载该数据集,调用`load_dataset`函数即可获得训练集。随后可转换为Pandas DataFrame进行探索性分析,如过滤出全国层面且不分性别的数据(通过筛选`dim1`列结尾为`_BTSX`或为空值),或针对特定国家(如肯尼亚,ISO代码KEN)提取时间序列,并依年度排序。数据集设计支持简单的条件过滤与聚合操作,适合快速评估非洲各国Hib疫苗接种覆盖率的时空变化趋势。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)创建,并由Electric Sheep Africa团队重新整合为机器学习友好的格式,发布于2024年。核心研究问题聚焦于非洲1岁儿童中b型流感嗜血杆菌(Hib)第三剂疫苗(Hib3)的覆盖率,这一指标是衡量非洲地区儿童免疫规划成效的关键。数据集覆盖2000至2024年间47个非洲国家的年度观测值,共计1164条记录,为非洲公共卫生研究提供了系统、标准化且易于获取的纵向数据。其发布对推动非洲免疫覆盖率的空间、时间及预测性分析产生了重要影响,有助于国际组织和各国卫生部门制定更具针对性的干预策略。
当前挑战
该数据集所解决的领域挑战在于,非洲地区Hib疫苗覆盖率数据长期分散、格式不一,缺乏统一的机器学习就绪格式以支持建模与预测分析。具体挑战包括:数据整合过程中需要从WHO的OData API中提取并清洗复杂数据,保留点估计值与置信区间,同时处理缺失信息;覆盖47个国家与25年间跨度,不同地区的数据采集频率与质量控制标准差异显著,可能导致时序分析中的空缺与偏倚;此外,部分记录可能存在亚群维度(如性别、城乡)缺失,增加了跨维度聚合与机器学习建模的复杂性。
常用场景
经典使用场景
在公共卫生与流行病学研究中,该数据集被广泛用于构建预测模型,以估计非洲各国1岁儿童Hib3疫苗接种覆盖率的时空变化趋势。研究人员常将其作为监督学习任务中的回归目标变量,结合社会经济、地理或政策特征,探索影响免疫覆盖率的关键因素。
解决学术问题
该数据集系统性地填补了非洲区域在Hib3免疫覆盖率长期、跨国标准化观测方面的数据空白,使得学者能够通过定量方法评估疫苗推广政策的有效性、识别覆盖率低下的热点地区,并定量分析资源分配不均与免疫障碍之间的关联,为循证卫生决策提供了坚实的数据支撑。
衍生相关工作
基于该数据,研究者衍生了多项经典工作,包括开发非洲多国免疫覆盖率时空插值模型、构建与GDP及教育水平相关的因果推断框架,以及将免疫数据集成至全球疾病负担研究与健康公平性分析中。此外,该数据集还激励了面向低资源地区的弱监督学习与迁移学习方法的创新,推动了公共卫生数据科学在非洲的落地与发展。
以上内容由遇见数据集搜集并总结生成



