five

electricsheepafrica/africa-who-yellow-fever-vaccine-immunization-coverage-among-1-year-olds

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-yellow-fever-vaccine-immunization-coverage-among-1-year-olds
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标1岁儿童黄热病疫苗(YFV)免疫覆盖率(%)的国家级观测数据,覆盖非洲国家,时间跨度为2000年至2024年。数据来源于WHO Global Health Observatory OData API,并重新打包为Parquet文件,具有一致的架构。所有数值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集是[Electric Sheep Africa]集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator Yellow fever vaccine (YFV) immunization coverage among 1-year olds (%) (`VACCINECOVERAGE_YFV`) across African nations, spanning 2000–2024. It is part of the [Electric Sheep Africa] collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
黄热病作为非洲地区主要的疫苗可预防疾病之一,其免疫覆盖率的监测对公共卫生决策至关重要。该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,由Electric Sheep Africa项目统一整合为机器学习就绪的Parquet格式文件。数据完整保留了原始API中的浮点精度数值(NumericValue)作为核心指标,同时纳入置信区间边界值以支持不确定性分析。所有记录均遵循一致的列式架构,覆盖2000至2024年间25个非洲国家的533条观察数据,并通过ParentLocationCode严格限定为WHO非洲区域(AFR)。
特点
该数据集的核心特色在于其高度结构化的多维元数据设计。除标准的地理(country_iso3)与时间(year)维度外,schema中还预设了dim1/dim2字段以支持未来分层指标的扩展(如性别、居住地类型),当前版本则表示单一值每国家-年组合。关键字段value_numeric提供浮点精度点估计值,而value_low与value_high字段在可用时补充了置信区间信息,为统计建模和稳健性检验提供原生支持。所有数值字段均避免使用显示字符串,确保机器学习流水线的数据一致性。
使用方法
研究人员可通过HuggingFace的datasets库一键加载数据集,返回的Arrow格式可直接转为Pandas DataFrame进行分析。典型的使用流程包括:通过dim1字段过滤出全国总人口(_BTSX后缀)的数据子集以消除分层干扰;利用country_iso3列按国家筛选时间序列数据,并结合year字段排序进行趋势分析。对于缺失置信区间的记录,可通过pandas的isna方法进行标记。该数据集亦支持直接作为监督学习任务的回归目标,以value_numeric作为预测变量,或依据置信区间宽度构建加权回归模型。
背景与挑战
背景概述
黄热病作为一种由蚊虫传播的急性病毒性出血热,在非洲地区持续构成严峻的公共卫生威胁。世界卫生组织(WHO)全球卫生观察站(GHO)于2024年发布了该数据集,旨在系统追踪非洲1岁儿童黄热病疫苗(YFV)接种覆盖率。该数据集由Electric Sheep Africa团队通过WHO GHO OData API采集并重新整理,涵盖2000至2024年间25个非洲国家的533条观测记录。核心研究问题聚焦于评估区域免疫接种成效,揭示疫苗覆盖率的不均衡分布。作为统一、机器学习就绪的非洲数据资源,该数据集为流行病学建模、政策制定及干预策略优化提供了标准化、可复现的量化基础,在促进非洲公共卫生数据科学与循证决策方面具有重要影响力。
当前挑战
该数据集所解决的领域核心挑战在于黄热病疫苗覆盖率长期存在的数据碎片化与不透明性,现有手动搜集的统计往往滞后、口径不一,难以支撑预测建模和精准干预。构建过程中面临多重挑战:首先,原始API返回的数据存在维度差异,部分观测缺乏性别或城乡分层信息,需要精细化的过滤与标准化处理;其次,置信区间字段(value_low、value_high)大量缺失,限制了不确定性量化分析的全面性;此外,不同国家间报告频率、更新时效和记录完整性参差不齐,533条样本不足以覆盖所有非洲国家,导致时空推断面临严重的数据稀疏性。
常用场景
经典使用场景
该数据集聚焦于非洲地区1岁儿童黄热病疫苗免疫覆盖率,是公共卫生领域经典的时序预测与分类任务基石。研究者可利用其横跨2000至2024年的国家层面观测值,构建机器学习模型以推断疫苗接种趋势、识别覆盖率波动模式,或预测未来免疫水平。数据集的简洁结构(含点估计值及置信区间)使其特别适合用于回归分析,评估不同国家卫生政策对免疫覆盖率的影响,也能作为多分类任务中的基线,标记覆盖率高低等级。其统一、整洁的Parquet格式大幅简化了数据预处理流程,为跨国家比较和时间序列建模提供了开箱即用的便捷性。
实际应用
在实际场景中,该数据集常被国际卫生组织、非政府机构及国家疾控部门用于监测与规划黄热病疫苗接种项目。借助其逐年更新的覆盖率数据,公共卫生官员可以识别免疫空白区域,优先分配疫苗资源并制定补种策略。数据也可嵌入早期预警系统,通过分析覆盖率下降趋势,协助预测潜在黄热病暴发风险,从而及时响应。此外,该数据集可作为投资评估工具,帮助决策者比较不同国家或地区在免疫覆盖率提升方面的成效,优化国际援助资金的使用效率。
衍生相关工作
该数据集衍生出了一系列围绕全球健康监测与机器学习交叉领域的重要工作。例如,基于此数据构建的时空回归模型,可结合气候、人口流动等辅助数据,增强对黄热病传播动力学的预测。同时,不少研究将其作为基准数据集,开发用于不平衡分类的免疫覆盖率分级算法,或设计处理小样本国别数据的迁移学习方法。此外,该数据集还推动了跨国别免疫趋势的可视化分析工具的诞生,如交互式仪表板,直观呈现免疫进展与挑战。这些工作不仅丰富了流行病学建模手法,也为其他传染病覆盖数据集的分析范式提供了参考模板。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务