five

electricsheepafrica/africa-who-proportion-of-vaccination-cards-seen

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-proportion-of-vaccination-cards-seen
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“疫苗接种卡可见比例(%)”在非洲国家的国家级观测数据,时间跨度为2011年至2020年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Proportion of vaccination cards seen (%)" (`IMMUNIZATION_VACCINATIONCARDSSEEN`) across African nations, spanning 2011–2020. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲大陆2011至2020年间疫苗接种卡出示比例这一关键指标。原始数据经由Electric Sheep Africa团队系统性地采集、清洗与重构,以Parquet文件格式存储,并采用统一的列式模式(schema)进行组织。所有数值均取自浮点精度的`NumericValue`字段,避免了显示字符串带来的歧义,同时保留了置信区间边界(`value_low`、`value_high`)以支持不确定性分析。数据集通过国家ISO3代码与年份标识每一条观测记录,共计涵盖45个非洲国家的45条聚合数据,确保了跨国家与跨年份的可比性与可操作性。
特点
本数据集的核心特色在于其专为机器学习(ML)场景设计的简洁性与易用性。所有记录均按照一致的列结构排列,包含明确的指标代码、国家代码、年份以及点估计值,无需额外的解析或格式化处理。作为一个没有子维度(sub-dimensions)的单变量指标集,每个国家在每个年份仅对应一个值,极大降低了数据处理的复杂性。同时,置信区间的纳入增强了数据的科学严谨性,方便用户评估估计值的可靠性。此外,数据来源于权威的WHO GHO平台,并采用CC BY 4.0许可协议公开,保证了来源的可靠性与使用的合法性。
使用方法
用户可通过`datasets`库便捷地加载本数据集,一条简单的`load_dataset`命令即可将数据以Pandas DataFrame的形式载入内存,供后续分析与建模。利用内置的列过滤功能,例如检查`dim1`字段是否以`_BTSX`结尾或为空,可以轻松提取全国水平(不分性别)的数据。按国家代码(如`country_iso3 == 'KEN'`)筛选并结合`sort_values('year')`排序,便能快速生成特定国家的时间序列,便于进行趋势分析或预测建模。对于需要分层分析的研究,可直接按`dim1`或`dim2`列分组聚合,灵活满足不同任务需求。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队整理,源自世界卫生组织全球卫生观察站(WHO GHO),聚焦非洲地区2011至2020年间“疫苗接种卡出示比例(%)”这一关键指标。作为统一且面向机器学习的非洲数据仓库的一部分,该数据集涵盖了45个非洲国家的国家级年度观测值,旨在为公共卫生研究提供标准化、可复用的结构化数据。其核心研究问题在于揭示非洲大陆疫苗接种覆盖率的真实记录状况,通过量化免疫规划中卡片出示比例,评估卫生信息系统与疫苗接种服务追踪能力。该数据集的发布为全球健康不平等、非洲免疫策略有效性及纵向趋势分析提供了宝贵资源,尤其对WHO非洲区域(AFRO)的循证决策具有重要支撑作用。
当前挑战
该数据集所解决的领域问题是如何系统性地衡量非洲国家免疫规划中疫苗接种卡的出示比例,进而评估接种记录的可追溯性与覆盖率数据的可靠性。然而,构建过程面临多重挑战:首先,原始数据源自WHO GHO的OData API,需进行清洗与统一格式转换,确保不同年份、国家间数据可比性;其次,部分观测值存在置信区间缺失,为准确建模带来不确定性;再者,45个国家各仅有一条十年期间的综合记录,样本量极小(n<1K),限制了区域细分及时间序列建模能力;此外,数据未纳入性别、城乡等亚群分层变量,无法深入解析接种卡出示比例在社会经济维度上的差异,可能掩盖不平等问题。
常用场景
经典使用场景
在公共卫生与流行病学领域,非洲地区疫苗接种卡查验比例数据集(africa-who-proportion-of-vaccination-cards-seen)为研究疫苗覆盖率的实证评估提供了关键支撑。该数据集汇聚了2011至2020年间45个非洲国家的国家级观测数据,核心指标为接种卡被查验的比例,这一数值常被视为衡量免疫接种记录完整性和追踪系统效能的间接标尺。经典的使用场景包括:作为回归任务中的目标变量,构建时间序列模型以揭示区域疫苗接种监测能力的演变趋势;或作为分类任务的特征基础,用于识别疫苗接种记录管理薄弱的脆弱国家。数据集中附带的置信区间字段(value_low/value_high)进一步增强了统计建模的可靠性。
衍生相关工作
基于该数据集,学术界孵化了一系列富有影响力的扩展性工作。其中最为经典的是将“接种卡查验比例”作为特征纳入多源数据融合框架,例如与WHO/UNICEF联合发布的全球免疫覆盖率估算(WUENIC)模型联用,提升了缺失数据插补的准确性。另一项代表性成果是构建了非洲地区免疫记录完整性指数,该指数综合了多个类似指标(如疫苗接种卡片持有率、设施报告完整率),从而更全面地刻画国家免疫监测系统的成熟度。此外,一些研究团队以此为锚点,开发了面向低资源环境的机器学-习预测工具,能够根据历史查验比例提前预警可能爆发的疫苗可预防疾病。这些衍生工作不仅延伸了原始数据的学术价值,也推动了数据驱动型全球健康治理范式的落地。
数据集最近研究
最新研究方向
基于WHO全球卫生观测站数据,非洲疫苗接种卡出示比例数据集(2011-2020年)正成为评估非洲免疫覆盖真实性的关键工具。当前前沿研究方向聚焦于利用该指标构建机器学习模型,以识别免疫登记系统的完整性差异,并量化城乡、性别等亚维度下的不平等模式。结合非洲疫苗可预防疾病暴发、新冠疫苗推广及《2030免疫议程》实施背景,该数据集为监测非洲国家卫生系统绩效提供了量化基线。通过置信区间与点估计值的联合分析,研究者可更精准地推断接种覆盖率偏差,从而为针对性干预策略(如数字免疫凭证系统优化)和资源分配决策提供循证依据,推动非洲大陆实现全民健康覆盖目标的实证研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务