five

electricsheepafrica/africa-who-measles-containing-vaccine-second-dose-immunization

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-measles-containing-vaccine-second-dose-immunization
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2024年间,按国家推荐年龄接种麻疹疫苗第二剂(MCV2)的免疫覆盖率百分比(WHO GHO指标)的国家级观测数据。它是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Measles-containing-vaccine second-dose (MCV2) immunization coverage by the nationally recommended age (%)" (`MCV2`) across African nations, spanning 2000–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的公开数据,聚焦于非洲大陆47个国家在2000至2024年间,麻疹类疫苗第二剂(MCV2)在国家推荐年龄内的免疫覆盖率,并以百分比形式呈现。数据经由OData API直接拉取,经过统一模式的清洗与重构,以Parquet文件格式存储,其中数值字段采用浮点精度的原始值,同时保留了置信区间上下界,从而为后续分析提供可靠的数据基础。
特点
数据集的显著特点在于其针对非洲区域的专一性与时间跨度长,覆盖了47个非洲国家长达24年的观测值,总计1164条记录。每个国家-年份组合对应单一数值,无额外分层维度,确保了数据的简洁性与可比性。此外,数据集中包含置信区间字段,为不确定性的量化评估提供了支持,是公共卫生领域进行趋势分析与政策评估的优质资源。
使用方法
借助HuggingFace的datasets库,用户可便捷加载该数据集并转化为Pandas DataFrame,便于进行后续探索。例如,可通过过滤dim1字段中后缀为_BTSX的条目或处理缺失值,获取全国性的两性混合数据。针对特定国家的时序分析,可依据country_iso3字段筛选并依年份排序,从而高效地挖掘各国在MCV2接种覆盖率上的变化轨迹与模式。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)于2024年发布,并由Electric Sheep Africa团队进行整合与重新封装,专注于非洲47个国家2000年至2024年间麻疹疫苗第二剂(MCV2)免疫覆盖率的时间序列数据。核心研究问题聚焦于非洲地区MCV2覆盖率的变化趋势与地理分布,旨在为麻疹消除策略提供数据支撑。作为WHO GHO体系的关键指标之一,该数据集为公共卫生政策制定者、流行病学家和机器学习研究者提供了标准化、统一结构的高质量数据集,弥补了非洲区域免疫监测数据碎片化的短板,对评估疫苗接种计划效果、识别低覆盖热点地区具有重要推动作用。
当前挑战
该数据集解决的核心领域挑战是非洲地区MCV2覆盖率预测与监测中的数据稀疏性和不完整性问题。由于非洲国家报告系统不完善,许多年份或国家的数值缺失严重,限制了传统统计方法的适用性。构建过程中面临的挑战包括:从WHO OData API提取数据时需处理复杂的数据类型转换与缺失值编码(如置信区间部分缺失);不同国家间报告标准不一致导致维度字段(如性别、居住区域)存在大量空值,增加了数据清洗与质量控制的难度;同时,将47个国家的异构原始数据整合为统一Parquet格式的ML就绪数据,需确保时间序列连续性和跨国家可比性,这考验了数据管道设计的鲁棒性。
常用场景
经典使用场景
在公共卫生与流行病学研究中,非洲地区麻疹疫苗第二剂(MCV2)覆盖率数据是评估国家免疫规划执行成效的核心指标。研究者可借助该数据集,对47个非洲国家长达二十余年的MCV2覆盖率进行纵向追踪,构建时间序列模型以揭示区域免疫推进的动力学特征。通过整合置信区间信息,不仅能精确刻画疫苗接种率的时空演变轨迹,还能基于WHO标准化指标开展跨国别对比分析,为优化疫苗接种策略提供量化依据。
实际应用
在实际应用中,该数据集直接服务于世界卫生组织非洲区域办公室的免疫接种监测体系,可用于生成国家和地区层面的MCV2覆盖率年度报告,辅助识别免疫薄弱地区。对于国际非营利组织而言,基于这些数据建立的预警模型能够动态评估麻疹暴发风险,优先调配疫苗资源。同时,各国卫生部门可结合该数据集校验本地登记系统的完整性,校准免疫规划目标,将数据洞察转化为具体的公共卫生资源配置决策。
衍生相关工作
基于此数据集,衍生出一系列聚焦非洲疫苗接种动力学的经典研究工作。其中代表性方向包括构建贝叶斯时空模型以插补缺失的覆盖率记录,发展基于图神经网络的区域传播预测框架,以及利用因果推断方法评估自然灾害对接种进度的异质性影响。此外,该数据集还催生了将MCV2覆盖率与社会经济指标交叉编码的跨领域分析,为验证免疫投资回报理论提供了实证基础,推动了数据驱动型全球健康治理的学术社区培育。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务