electricsheepafrica/africa-who-measles-containing-vaccine-first-dose-immunization-coverage
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-measles-containing-vaccine-first-dose-immunization-coverage
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标1岁儿童麻疹疫苗第一剂(MCV1)免疫覆盖率(%)(WHS8_110)在非洲国家的国家层面观察数据,时间跨度为2000年至2024年。它是Electric Sheep Africa集合的一部分——一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于世界卫生组织全球健康观察OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Measles-containing-vaccine first-dose (MCV1) immunization coverage among 1-year-olds (%)" (`WHS8_110`) across African nations, spanning 2000–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区1岁儿童中含麻疹疫苗第一剂(MCV1)的免疫覆盖率指标(代码WHS8_110)。原始数据经Electric Sheep Africa项目统一整理,以Parquet文件格式重新封装,并采用一致的列式结构。所有数值均取自高精度的浮点字段NumericValue,而非显示字符串,同时保留了置信区间上下界。数据覆盖2000至2024年间47个非洲国家的1,164条观测记录,按国家ISO代码和年份组织,构成了一个面向机器学习、可直接使用的时序数据集。
特点
该数据集的核心特征在于其简洁性与专注性:每个国家每年仅对应一条记录,无额外的亚维度分层,降低了分析的复杂度。所有观测值均为浮点型的点估计,并附带了上下置信区间,便于进行不确定性量化。数据经过严格清洗,仅保留WHO非洲区域(AFRO)的观测,确保了地域聚焦。此外,数据集提供了标准化的ISO代码和完整的元数据字段,包括指标编码、更新时间戳等,使其易于与其他非洲健康数据集进行跨来源联合分析。
使用方法
数据集可通过HuggingFace Datasets库直接加载,使用load_dataset函数即可将数据转换为Pandas DataFrame格式进行后续处理。对于大多数分析场景,推荐按性别或居住地类型进行过滤,例如提取全国性男女合计数据时,可筛选dim1字段以_BTSX结尾的行。研究人员可利用年份和ISO代码构建面板数据,进行时序趋势分析或跨国比较,例如对特定国家(如KEN)的数据按年份排序以观察其免疫覆盖率的动态演变。
背景与挑战
背景概述
在公共卫生领域,疫苗接种覆盖率是衡量免疫规划成效和防控传染病传播的关键指标。世界卫生组织(WHO)发布的含麻疹疫苗第一剂(MCV1)在1岁儿童中的免疫覆盖率数据,直接反映了各国麻疹防控能力的强弱。由Electric Sheep Africa团队于2024年整理的该数据集,汇集了WHO全球卫生观察站(GHO)自2000年至2024年间47个非洲国家的年度观测值,共计1164条记录。该数据集聚焦于非洲地区,为研究区域卫生不平等、评估免疫计划执行效果以及构建预测模型提供了标准化的机器学习就绪数据,对推动非洲大陆的精准公共卫生决策与流行病学建模具有重要价值。
当前挑战
该数据集所解决的领域问题核心在于,非洲地区长期面临麻疹疫苗覆盖率低且时空分布不均的挑战,亟需高质量、结构化的时间序列数据来支撑免疫成效的量化分析与预测。具体挑战有三:其一,原始WHO数据存在缺失值,且置信区间信息不完整,需在构建过程中谨慎处理插值与不确定性建模;其二,数据涵盖47个国家、跨25年,不同国家的报告标准与统计口径存在差异,整合时需确保一致性与可比性;其三,部分指标存在按性别或居住地类型的分层维度,处理多维度交叉的稀疏数据,增加了特征工程与建模的复杂性。
常用场景
经典使用场景
在公共卫生与流行病学的研究领域中,该数据集最经典的用途在于对非洲地区一岁儿童麻疹含疫苗首剂接种覆盖率的长期趋势进行时间序列分析与横截面比较。研究者可基于国家层面的年度观测值,剖析2000年至2024年间47个非洲国家的免疫覆盖率演变轨迹,揭示区域内部的不均衡现象,并评估全球疫苗行动计划在非洲大陆的阶段性成效。该数据集以机器可读的Parquet格式提供,天然适用于回归分析与分类任务的建模流程,为构建预测模型、监测免疫规划薄弱环节奠定了坚实的数据基础。
解决学术问题
该数据集精准回应了全球健康治理领域的两大核心学术问题:一是量化评估麻疹消除战略在非洲地区的推进进度,二是识别免疫覆盖率不足的关键影响因素及其空间异质性。通过提供长期、一致且标准化的覆盖率指标及置信区间,它使研究者能够突破传统调查数据的碎片化限制,进行跨国家、跨年代的稳健统计分析。由此推动了干预措施效果评估、疫苗需求预测以及卫生系统韧性研究的发展,其意义在于为循证决策提供了高颗粒度的实证依据,助力优化有限卫生资源的配置策略。
衍生相关工作
基于这一数据集,学术界涌现了一系列衍生性工作,涵盖时空建模、因果推断与政策模拟等多个前沿方向。经典案例如利用贝叶斯时空模型(如INLA)重建非洲国家连续的免疫覆盖率曲面,填补观测缺失年份的空白;另有多项研究将其与DHS调查数据结合,运用多水平逻辑回归剖析城乡差异、母亲教育水平等社会决定因素对接种率的影响。在机器学习领域,该数据集还被用作基准测试,评估梯度提升树、神经网络等算法在稀疏面板数据上的预测性能。这些衍生工作不仅深化了对非洲麻疹免疫动态机制的理解,也推动了公共卫生大数据分析方法的创新与标准化。
以上内容由遇见数据集搜集并总结生成



