five

electricsheepafrica/africa-who-full-immunization-coverage-among-one-year-olds

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-full-immunization-coverage-among-one-year-olds
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“一岁儿童全面免疫覆盖率(%)”(`vfull`)在非洲国家1993年至2019年的国家级观察数据。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据仓库。数据直接从WHO全球健康观察站的OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator "Full immunization coverage among one-year-olds (%)" (`vfull`) across African nations, spanning 1993–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于世界卫生组织全球卫生观察站(WHO GHO)的OData API获取原始数据,经过标准化处理并转换为Parquet格式,以确保一致性。数据集以国家为观测单位,覆盖1993年至2019年间41个非洲国家的“一岁儿童全面免疫覆盖率”指标。所有数值均取自精确的浮点字段,同时保留置信区间上下限,以便于后续统计分析与建模。数据经过了维度分层处理,每条记录代表国家、年份与特定子维度组合的观测值。
特点
该数据集的结构化特征体现在其层次化的子维度设计上,涵盖了年龄组、教育水平、居住地类型、性别、财富十分位数与五分位数等分类变量,为多维度分析奠定了坚实基础。它包含了超过5,990条记录,并非简单的面板数据,而是每个子维度组合均形成独立记录,提供了高分辨率的数据视角。此外,数据集保留了指标代码、ISO国家代码、WHO区域标签及更新时间戳等元数据,赋能精细的时空对比与群体间差异探索。
使用方法
利用HuggingFace的数据集加载库,用户可通过一行代码将数据导入Pandas DataFrame,进行灵活的数据操作。推荐针对“两性综合”及“国家层面”维度进行过滤,以获取无偏估计。对于单国时间序列分析,可直接按ISO代码筛选并依年份排序。数据天然适用于表格分类与回归任务,可基于子维度构造特征工程,开展免疫覆盖率影响因素的建模研究。
背景与挑战
背景概述
在全球公共卫生治理的宏观图景中,儿童免疫接种覆盖率是衡量国家卫生系统效能与可持续发展目标进展的核心指标。世界卫生组织(WHO)全球卫生观察站(GHO)自1993年起系统收集非洲地区一岁儿童全程免疫接种覆盖率数据,该数据集由Electric Sheep Africa团队于2021年前后重新整理并发布,覆盖41个非洲国家长达27年的观测记录,共计5990个样本。该数据集旨在为机器学习模型提供标准化、可直接使用的结构化数据,助力研究人员利用时间序列分析、分类与回归等方法,揭示非洲免疫接种的时空演变规律、区域差异及社会决定因素,从而为政策制定者优化疫苗接种策略提供数据驱动的科学依据。作为非洲健康数据统一化的重要尝试,该数据集填补了该领域高质量、长周期、跨国产出的空白,对推动全球健康不平等研究与AI辅助公共卫生决策具有深远影响。
当前挑战
该数据集所解决的领域问题聚焦于非洲儿童免疫覆盖率的精准刻画与预测,挑战在于:其一,数据稀疏性与时空异质性——1993至2019年间各国记录分布不均,部分国家年份缺失严重,模型需处理高度不平衡的时间序列;其二,亚组分层复杂性——数据按年龄组、性别、居住地类型、教育水平及财富十分位数等维度进行分层,多维度交叉导致样本稀疏,难以直接用于回归或分类任务。构建过程中,首要挑战是数据整合与清洗,WHO OData API原始数据存在字段冗余、字符串与数值格式混用及置信区间缺失等问题,需通过标准化架构提取NumericValue、重构维度标识符并统一Parquet存储格式;其次,跨维度聚合的取舍——为保留分层信息而引入的dim1/dim2字段增加了特征维度,如何在避免维度灾难的同时兼顾亚组分析需求,是数据建模的关键难题。
常用场景
经典使用场景
在公共卫生与流行病学领域,该数据集常被用于探索非洲国家一岁儿童全免疫覆盖率的时空演变规律。研究者可依据国家、年份与细分维度(如性别、城乡、财富五分位)进行分层分析,构建面板数据以评估免疫规划的覆盖效果。结合置信区间字段,可对点估计进行不确定性量化,支持稳健的统计推断。数据集的结构化设计使其天然适用于时间序列预测、趋势分解及因果推断等经典机器学习任务。
衍生相关工作
基于该数据集,研究者开发了多种预测模型与可视化工具,如利用时间序列方法预测未来免疫覆盖趋势,或结合地理信息系统绘制非洲免疫热力图。衍生工作还包括探讨免疫率与冲突、经济指数、气候事件等外部变量的关联分析,推动了跨学科融合研究。部分工作进一步将其与DHS或MICS调查数据整合,构建更精细的亚国家层面估计,拓展了数据集的边际价值。这些贡献共同提升了非洲免疫数据的可操作性与政策影响力。
数据集最近研究
最新研究方向
在全球公共卫生领域,儿童免疫覆盖率长期被视为衡量初级卫生保健体系效能的核心指标。该数据集聚焦非洲大陆41个国家1993至2019年间一岁儿童全程免疫覆盖率,基于WHO全球卫生观察站官方数据重构,并纳入性别、居住地类型、财富五分位等多维度分层信息,为探索非洲地区免疫服务可及性与公平性问题提供了精细化的数据基底。当前前沿研究重点围绕数据驱动的免疫差距识别与政策响应机制展开,借助该数据集可深入剖析国家内部及跨国的免疫覆盖率异质性,结合时间序列建模与空间分析,揭示社会经济地位、区域发展水平与公共卫生投入对免疫成效的交互影响。在疫情后全球免疫规划复苏的背景下,此类细粒度数据对追踪“大免疫回落”趋势、优化资源分配策略及监测2030免疫议程进展具有不可替代的实证价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作