five

electricsheepafrica/africa-who-bcg-immunization-coverage-among-1-year-olds

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-bcg-immunization-coverage-among-1-year-olds
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家WHO GHO指标“1岁儿童BCG免疫覆盖率(%)”(WHS4_543)的国家级观测数据,时间跨度为2000年至2024年。它是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察站OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low、value_high)。数据集覆盖47个非洲国家,总行数为1,164行,区域筛选为WHO AFRO(ParentLocationCode = AFR)。

This dataset contains country-level observations for the WHO GHO indicator "BCG immunization coverage among 1-year-olds (%)" (WHS4_543) across African nations, spanning 2000–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 1,164 rows, filtered by WHO AFRO region (ParentLocationCode = AFR).
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区1岁儿童卡介苗(BCG)免疫覆盖率的国家层面观测数据。数据覆盖2000年至2024年,包含47个非洲国家的1164条记录。所有数值均基于精确的浮点字段(NumericValue)提取,而非显示字符串,并整合了置信区间上下限(value_low与value_high)等辅助信息。数据集以Parquet文件格式重新打包,采用统一模式,确保了数据集在机器学习任务中的即用性与流畅转换。
特点
该数据集最显著的特点在于其专为机器学习设计的结构一致性,每个国家-年份组合对应单一观测值,避免了多维度复杂分层。数据集中包含了标准化字段如indicator_code、country_iso3、year、value_numeric等,以及可选的dim1/dim2用于处理潜在的分层变量。所有条目均来自WHO AFRO区域,且无子维度划分,极大精简了数据复杂度,便于直接聚焦于核心免疫覆盖率预测或回归任务。数据集还附带了WHO数据最后更新时间戳,增强了可追溯性和时效性。
使用方法
用户可通过HuggingFace的datasets库轻松加载该数据集,调用load_dataset函数后即可将数据转换为pandas DataFrame进行分析。推荐在建模前进行初步过滤,例如选择双方性别(both-sexes)或国家级别的记录,以避免分层变量带来的噪声。对于时间序列分析场景,可按国家ISO代码筛选并依据年份排序。该数据集特别适用于二元分类(如高覆盖率vs低覆盖率)或连续值回归任务,也可作为非洲公共卫生研究的基线数据集,支持年度趋势监测与跨国比较分析。
背景与挑战
背景概述
在全球公共卫生领域,监测婴幼儿免疫接种覆盖率对于评估疾病防控效果、制定精准干预措施至关重要。世界卫生组织全球卫生观察站(WHO GHO)发布的“非洲1岁儿童BCG免疫覆盖率”数据集(WHS4_543),由Electric Sheep Africa团队于2024年整理并公开。该数据集聚焦非洲47个国家,覆盖2000至2024年间的年度观测数据,共计1164条记录,为研究卡介苗(BCG)在非洲大陆的接种趋势、区域差异及其与结核病防控的关联提供了统一、机器可读的高质量数据基础。数据集采用CC BY 4.0许可,源自WHO官方OData API,经标准化处理后以Parquet格式发布,简化了多国长时序数据分析的流程,推动了非洲健康数据在机器学习与流行病学建模中的可复现应用。
当前挑战
该数据集所解决的领域问题核心在于,非洲婴幼儿BCG接种覆盖率长期面临数据碎片化、统计口径不一及时序不连续等挑战。传统上,各国接种数据分散于不同报告体系中,难以整合分析,而本数据集通过统一指标编码、标准化变量命名及置信区间字段(value_low、value_high)的引入,有效支持了跨国比较与趋势建模。在构建过程中,主要挑战包括:从WHO API获取的原始数据存在维度标注不一致(如性别、城乡分层字段dim1/dim2的缺失与重复)、部分年份和国家的观测值缺失,以及数值字段(NumericValue)与显示字符串(value_display)的精度差异需严格对齐。团队通过过滤WHO AFRO区域、剔除冗余子维度记录、保留浮点精度值等方式,保证了数据集的完整性与可靠性。
常用场景
经典使用场景
在公共卫生与流行病学的研究版图中,该数据集构成了评估非洲地区结核病防控成效的核心工具。研究者可基于2000至2024年间47个非洲国家的卡介苗(BCG)覆盖率数据,构建时间序列模型以描绘免疫接种的历史轨迹与地理分布格局。其经典用途在于借助纵向数据揭示各国在实现世界卫生组织(WHO)消除结核病目标进程中的覆盖率波动,从而识别出免疫体系的薄弱环节与成功经验。
衍生相关工作
基于该数据集,已衍生出一系列具有影响力的研究工作。例如,学者利用其构建了预测模型,评估新冠疫情对非洲常规免疫服务的冲击程度;亦有团队将覆盖率数据与疫苗犹豫(vaccine hesitancy)的社会调查相结合,深入剖析导致接种率不均的深层因素。此外,围绕数据本身的标准化处理,催生了将WHO复杂API接口简化为机器学习就绪格式的预处理流程,为后续跨数据集整合分析铺平了道路。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区1岁儿童卡介苗(BCG)免疫覆盖率的多国长期追踪,覆盖2000至2024年间的47个非洲国家,为全球公共卫生领域研究免疫服务可及性与公平性提供了关键数据基础。当前前沿研究方向包括利用机器学习模型预测疫苗接种覆盖率的时间趋势与空间异质性,探索社会经济、地理环境及政策干预对免疫效果的交互影响。结合WHO“2030免疫议程”中消除疫苗可预防疾病的目标,该数据集有助于识别免疫薄弱区域、优化资源分配策略,并支撑疫情后免疫体系恢复力评估,对推动非洲儿童健康公平与全球流行病防控具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作