electricsheepafrica/africa-who-rotavirus-vaccines-completed-dose-immunization-coverage
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-rotavirus-vaccines-completed-dose-immunization-coverage
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标1岁儿童完成轮状病毒疫苗(RotaC)免疫覆盖率(%)在非洲国家的国家级观测数据,时间跨度为2006年至2024年。它是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖47个非洲国家,共888行数据,区域筛选条件为WHO非洲区域(ParentLocationCode = AFR)。
This dataset contains country-level observations for the WHO GHO indicator Rotavirus vaccines completed dose (RotaC) immunization coverage among 1-year-olds (%) (ROTAC) across African nations, spanning 2006–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with 888 total rows, filtered by WHO AFRO region (ParentLocationCode = AFR).
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,聚焦于非洲地区1岁儿童轮状病毒疫苗全程接种(RotaC)覆盖率。数据通过统一架构重新封装为Parquet格式,包含47个非洲国家2006至2024年间共计888条观测记录。所有指标均采用浮点精度的数值字段(NumericValue),并附有置信区间上下限,确保机器学习任务的数据一致性。
特点
数据集以国家-年份为唯一键,无额外维度分层,提供简洁的表格结构。关键列包括指示代码(ROTAC)、国家ISO3代码、WHO区域、年份、点估计值及置信区间。数据来源权威(WHO官方),覆盖广泛(47国),时间跨度近20年,且经过标准化处理,便于直接用于回归或分类任务。缺失值处理透明,置信区间为不确定性量化提供支持。
使用方法
用户可通过HuggingFace Datasets库轻松加载数据,例如`load_dataset('electricsheepafrica/africa-who-rotavirus-vaccines-completed-dose-immunization-coverage')`,并转换为Pandas DataFame进行分析。推荐过滤仅保留全国及两性总体的观测(即dim1为_BTSX或缺失的行),以聚焦宏观趋势。时间序列分析可按国家筛选,如`df[df['country_iso3'] == 'KEN'].sort_values('year')`,支持疫苗覆盖率的历史演变研究。
背景与挑战
背景概述
轮状病毒是导致全球5岁以下儿童重症腹泻乃至死亡的主要病原体之一,尤其在卫生资源匮乏的非洲地区,其疾病负担尤为沉重。世界卫生组织(WHO)全球卫生观测站(GHO)自2006年起监测并发布非洲各国1岁儿童轮状病毒疫苗全程接种(RotaC)覆盖率数据。该数据集由Electric Sheep Africa团队整理,以机器学习就绪的Parquet格式,整合了47个非洲国家2006至2024年间的888条观测记录,旨在为区域免疫规划评估、流行病学建模及公共卫生政策制定提供标准化的量化基础。作为非洲健康数据统一存储库的一部分,该数据集填补了非洲地区高质量、可复用免疫接种时间序列数据的空白,有力推动了数据驱动的全球健康研究。
当前挑战
该数据集所解决的领域问题核心在于:非洲地区长期缺乏系统、可比且易于机器学习建模的轮状病毒疫苗接种覆盖率数据,使得疫病传播动力学研究、免疫缺口识别及干预策略优化受到严重制约。构建过程中面临的挑战包括:第一,原始数据源自WHO OData API,需对多维度编码字段进行清洗与标准化,确保年份与国别字段的兼容性;第二,部分国家年份的观测存在置信区间缺失或数值断裂,需通过`value_low`与`value_high`列保留不确定性信息;第三,不同国家上报频次与数据质量参差不齐,需在保持时间序列完整性的同时避免引入插值偏见;第四,数据集需整合为无子维度聚合的单值框架,以适配分类与回归任务,同时保留`dim1`/`dim2`以支持分层分析。
常用场景
经典使用场景
轮状病毒是全球婴幼儿重症腹泻的主要病原体,尤其在卫生基础设施薄弱的非洲地区,接种疫苗是降低发病率和死亡率的核心干预手段。该数据集聚焦于非洲各国1岁儿童完成轮状病毒疫苗接种的覆盖率,整合了WHO全球卫生观察站2006至2024年间47个非洲国家的年度观测数据,为研究免疫接种趋势提供了标准化、机器可读的时间序列资料。其经典用途在于构建区域疫苗覆盖率的时空演变模型,分析不同国家间接种水平的差异,并作为评估国家免疫规划成效的定量基准。
解决学术问题
在公共卫生与流行病学领域,该数据集填补了非洲大陆系统性、长周期轮状病毒疫苗接种覆盖数据的空白。它解决了两个核心学术问题:一是如何量化疫苗覆盖率随时间的变化轨迹,以揭示免疫工作的推进速度与瓶颈;二是如何识别覆盖率异常值或骤降事件,从而关联政策变动、疫情暴发或资源分配不均等潜在驱动因素。其意义在于为卫生经济学家提供建模参数,为流行病学家评估疫苗群体免疫效果提供实证依据,推动全球儿童健康目标的量化监测。
衍生相关工作
该数据集已衍生出若干关键研究工作。其一,基于机器学习的覆盖率预测模型被提出,利用历史年度数据结合社会经济特征,预测未来接种缺口;其二,异常检测框架被应用于识别数据中的极端波动,结合冲突或疾病爆发事件进行因果推断;其三,时空聚类分析方法被开发,用以揭示覆盖率在边界国之间是否存在空间扩散模式,为跨境免疫合作提供量化证据。这些工作共同丰富了非洲疫苗政策评估的方法论基础。
以上内容由遇见数据集搜集并总结生成



