five

electricsheepafrica/africa-who-bcg-immunization-coverage-among-one-year-olds

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-bcg-immunization-coverage-among-one-year-olds
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站指标“一岁儿童BCG免疫覆盖率(%)”在非洲国家的国家级观察数据,时间跨度为1993年至2019年。该数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习应用的非洲数据存储库。数据直接从WHO全球健康观察站OData API获取,并重新打包为具有一致模式的Parquet文件。所有值均来自浮点精度字段`NumericValue`,而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator "BCG immunization coverage among one-year-olds (%)" (`vbcg`) across African nations, spanning 1993–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的官方OData API,聚焦非洲地区一岁儿童卡介苗(BCG)免疫覆盖率(指标代码vbcg)。数据涵盖了1993年至2019年间41个非洲国家的6,020条观测记录,所有数值均提取自高精度浮点字段NumericValue,而非显示字符串。为便于机器学习应用,原始数据被重新封装为统一的Parquet文件格式,并保留了置信区间上下限等关键统计信息。当指标按性别、年龄组等维度分层时,每个国家×年份×维度的独特组合均生成为独立行,确保了数据的细粒度与完整性。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据集,使用`load_dataset("electricsheepafrica/africa-who-bcg-immunization-coverage-among-one-year-olds")`即可获取训练集,并可将其转换为Pandas DataFrame进行后续分析。为获得国家层面的总体估计,建议筛选dim1字段以排除细分亚群(如过滤出`_BTSX`结尾的性别总体值或空值)。针对单个国家的时间序列分析,则可通过`country_iso3`列进行过滤并按`year`排序。数据集适用于分类与回归两类表格学习任务,可作为评估非洲公共卫生干预效果的可靠数据基础。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队基于世界卫生组织(WHO)全球卫生观察站(GHO)的公开数据重新整理而成,发布于Hugging Face平台,创建时间可追溯至2019年。其聚焦于非洲地区一岁以下儿童卡介苗(BCG)免疫覆盖率这一核心公共卫生指标,覆盖1993年至2019年间41个非洲国家的6020条观测记录。作为一项标准化、机器学习就绪的数据资源,它填补了非洲儿童免疫数据在开放性与可复现性方面的空白,为跨国健康差异分析、疫苗接种策略评估及流行病学建模提供了关键支撑,对推动非洲公共卫生决策的数据驱动转型具有显著影响力。
当前挑战
该数据集所解决的领域问题复杂而多元。首要挑战在于非洲地区BCG免疫覆盖率的准确量化,因各国卫生系统数据记录不完整、时间序列中断及区域差异显著,导致传统统计方法难以捕捉真实变化。其次,构建过程中面临多重障碍:原始WHO数据以异构格式存储,需统一清洗为一致的Parquet架构;不同国家与年份的置信区间缺失,增加了不确定性量化难度;此外,数据按性别、居住地类型、教育水平等维度分层,导致重复记录与聚合分析复杂化,需要研究者谨慎处理子群加权与缺失模式,以避免引入偏差。
常用场景
经典使用场景
在公共卫生与流行病学领域,非洲是结核病高负担区域,而卡介苗(BCG)作为预防结核病的关键疫苗,其接种覆盖率是衡量免疫规划成效的核心指标。该数据集汇集了1993至2019年间41个非洲国家的BCG免疫覆盖率年度观测值,并纳入性别、居住地类型、教育水平及财富分位数等多维度分层信息。研究人员常将其用于时间序列分析、区域对比研究及免疫覆盖率的纵向趋势建模,从而揭示非洲大陆在扩大免疫服务可及性方面的进展与瓶颈。
解决学术问题
该数据集有效回应了非洲地区免疫评估领域中因数据碎片化而难以进行跨国家、跨时段系统比较的困境。通过提供统一结构化、机器友好的数据格式,它支持学术界对BCG覆盖率不均等性的成因进行量化分析,例如探讨社会经济地位、城乡差异、教育程度与疫苗接种可及性之间的关联。这一基础性数据资源为验证免疫不平等假说、评估全球疫苗行动计划(GVAP)在非洲的落地成果提供了实证支撑,亦推动了区域健康政策循证决策的科学化进程。
实际应用
在实际应用层面,该数据集可直接服务于世界卫生组织及各非洲国家卫生部的免疫规划监测与预警系统。通过分析BCG覆盖率的变化轨迹,公共卫生管理者能够识别出接种薄弱地区与脆弱人群,进而优化疫苗分配策略与针对性干预方案。此外,该数据还可嵌入传染病传播动力学模型,帮助预估结核病发病率的变化趋势,为制定疫情应对预案和评估公共卫生干预效果提供量化依据,从而提升区域整体免疫防御能力。
数据集最近研究
最新研究方向
在全球公共卫生领域,卡介苗(BCG)免疫覆盖率是评估儿童传染病防控成效的关键指标。该数据集聚焦非洲41国1993至2019年间一岁儿童BCG疫苗接种率,整合了世界卫生组织全球卫生观察站的官方数据,并引入了性别、教育水平、居住地类型及财富等级等多维分层变量,为精准解析不平等免疫覆盖格局提供了坚实的数据基础。前沿研究方向已转向利用此类时序面板数据,结合空间统计与机器学习模型,揭示区域内部免疫差距的驱动因素——如社会经济剥夺程度或卫生系统可达性异质性——并评估其在“2030免疫议程”等全球健康倡议中的进展监测价值。数据集的公开标准化亦支持跨国比较、缺失值插补及政策干预效果的反事实推演,对非洲大陆实现疫苗公平具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作