electricsheepafrica/africa-who-pneumoccocal-conjugate-vaccines-immunization-coverage-among
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-pneumoccocal-conjugate-vaccines-immunization-coverage-among
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标1岁儿童接种肺炎球菌结合疫苗(PCV3)的覆盖率(%)(PCV3)在非洲国家的国家级观察数据,时间跨度为2008年至2024年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory的OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖47个非洲国家,共796行数据。
This dataset contains country-level observations for the WHO GHO indicator Pneumoccocal conjugate vaccines (PCV3) immunization coverage among 1-year-olds (%) (`PCV3`) across African nations, spanning 2008–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 47 African nations with a total of 796 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData应用程序编程接口,旨在系统性地收录非洲地区1岁以下儿童肺炎球菌结合疫苗(PCV3)的免疫覆盖率信息。数据经过重新封装为统一的Parquet格式文件,以确保机器学习任务的就绪性。所有数值均来源于高精度的浮点数字段,而非显示字符串,从而保障了数据计算的精确性。同时,在可用的情况下,数据集还包含了置信区间的上下界,为后续分析提供了更为丰富的统计信息。
特点
该数据集覆盖了2008年至2024年间47个非洲国家的796条观测记录,构成了一个时间跨度长、地理范围广的纵向面板数据集合。其核心特点在于无额外子维度划分,每个国家在每个年份仅对应一个唯一的覆盖率数值,这极大地简化了模型输入的复杂性。此外,数据集包含了如国家ISO3代码、WHO地区代码、观测年份以及格式化的显示值等多个字段,为多维度的数据分析提供了便利,且所有数据均遵循CC BY 4.0许可协议,具有高度的开放性和可重复利用性。
使用方法
使用者可以通过HuggingFace Datasets库便捷地加载该数据集,并将其转换为Pandas DataFrame格式进行操作,例如`from datasets import load_dataset`。针对特定的分析需求,例如研究全国范围内的总体覆盖率,可以依据`dim1`字段(例如以`_BTSX`结尾的值)过滤出男女合并的数据。为了进行时间序列或跨国比较,使用者可以直接利用`country_iso3`和`year`字段进行筛选与排序,比如选取特定国家(如肯尼亚,代码KEN)的数据并按年份排列,从而高效地开展回归分析或分类预测任务。
背景与挑战
背景概述
肺炎球菌性疾病是全球儿童疫苗可预防疾病的主要死因之一,尤其在非洲地区,由于医疗资源有限和监测体系薄弱,准确评估疫苗接种覆盖率成为公共卫生领域的关键挑战。该数据集由世界卫生组织全球卫生观察站(WHO GHO)发布,并经Electric Sheep Africa团队重新整理,聚焦于非洲47个国家2008至2024年间1岁儿童肺炎球菌结合疫苗(PCV3)的接种覆盖率。数据集整合了各国按年份记录的覆盖率点估计值及置信区间,为评估非洲地区肺炎球菌疫苗推广成效、识别接种薄弱环节提供了标准化的定量依据,对推动非洲免疫规划优化和全球卫生公平研究具有重要支撑作用。
当前挑战
该数据集面临的领域挑战在于,非洲国家普遍存在疫苗接种登记系统不完善、人口流动频繁及数据漏报问题,导致PCV3覆盖率的准确估算极为困难,且不同国家间的数据可比性受制于监测能力和统计方法的差异。在构建过程中,主要挑战包括从WHO GHO的OData API中提取并统一多国异构数据格式,处理缺失值与置信区间的不完整记录,以及确保数据的时间序列一致性,从而为机器学习任务提供干净的表格化训练数据。
常用场景
经典使用场景
该数据集的核心价值在于追踪非洲地区1岁儿童肺炎球菌结合疫苗(PCV3)免疫覆盖率的年度变化趋势。通过整合2008至2024年间47个非洲国家的官方监测数据,研究者可纵向分析各国疫苗接种计划的推进成效,识别覆盖率波动显著的年份或国家,从而为区域卫生政策制定提供量化依据。
实际应用
实际应用中,该数据集被国际组织与各国卫生部用于监测疫苗接种计划的执行质量,例如识别低覆盖率地区以优化疫苗分配资源。同时,它支持构建机器学习预测模型,预估未来免疫缺口,辅助应急预案制定,并可作为非洲疫苗可预防疾病监测系统的基础数据支柱。
衍生相关工作
该数据集衍生出多项经典研究,包括基于随机森林或线性回归的覆盖率影响因素分析,揭示人均医疗支出、政策稳定性与免疫率间的非线性关系。此外,它常与WHO全球卫生观察站的其他免疫指标(如麻疹疫苗覆盖率)联合使用,构建多维度疫苗公平性评价框架,或用于时空贝叶斯模型预测区域疫情风险。
以上内容由遇见数据集搜集并总结生成



