five

electricsheepafrica/africa-who-hepatitis-b-immunization-coverage-among-1-year-olds

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-hepatitis-b-immunization-coverage-among-1-year-olds
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家1岁儿童乙型肝炎(HepB3)免疫覆盖率的百分比数据,时间跨度为2000年至2024年。数据来源于世界卫生组织(WHO)全球健康观察站(GHO)的OData API,并以Parquet格式重新打包。数据集包含47个非洲国家的数据,共计1,164行。每行数据包括国家代码、年份、数值估计值、置信区间边界等信息。

This dataset contains country-level observations for the WHO GHO indicator "Hepatitis B (HepB3) immunization coverage among 1-year-olds (%)" (`WHS4_117`) across African nations, spanning 2000–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集依托世界卫生组织(WHO)全球卫生观察站(GHO)的OData应用程序编程接口,系统性地整合了非洲地区2000年至2024年间关于1岁婴儿乙型肝炎(HepB3)疫苗接种覆盖率(指标代码WHS4_117)的国家层级观测数据。数据经Electric Sheep Africa项目统一封装为Parquet格式,采用标准化列式架构,所有数值均源自高精度浮点型字段,并保留可用的置信区间上下界与格式化展示字符串,确保机器学习就绪。
特点
数据集以跨年度、跨国家为轴线,覆盖47个非洲国家,共计1164条记录,精准聚焦于每年度各国乙型肝炎疫苗第三剂(HepB3)的接种覆盖率百分比。其核心特色在于无子维度分层,即每个国家与年份的唯一组合对应单一观测值,极大简化了时空分析的门槛。同时,丰富的数据列如指示符代码、国家ISO3编码、WHO区域标识、点估计值与置信区间等,为回归预测与分类任务提供了坚实基座。
使用方法
用户可通过HuggingFace的datasets库便捷接入,首先使用load_dataset函数加载数据集,系统会返回包含单一训练分区的Datasets对象,其内部自动映射至Pandas DataFrame以便后续操作。对于多维度分析,建议基于dim1列筛选出性别为'SEX_BTSX'或该列为空的行,以获取全国各性别总体统计;若需追踪特定国家的时序演变,则可利用country_iso3列进行过滤,并依年份排序,即可获取如肯尼亚等国的连续接种率变化轨迹。
背景与挑战
背景概述
乙型肝炎(HepB)是全球重大公共卫生负担之一,而新生儿及婴儿期的免疫接种是阻断母婴传播、降低慢性感染率的关键干预措施。世界卫生组织(WHO)全球卫生观察站(GHO)于2024年发布了“非洲地区1岁儿童乙型肝炎(HepB3)免疫覆盖率”数据集,由Electric Sheep Africa团队从WHO GHO OData API系统化采集并重新打包,形成统一、适用于机器学习的结构化数据资源。该数据集覆盖2000至2024年间47个非洲国家共1,164条观测记录,聚焦于HepB3第三剂疫苗在1岁儿童中的覆盖率这一核心指标,旨在评估非洲区域免疫规划的实施进展,支持跨国家、跨时段的比较分析与健康政策研究。作为区域卫生数据标准化的重要尝试,该数据集为提升非洲免疫监测能力、追踪可持续发展目标中特定健康指标的达成情况提供了关键基础。
当前挑战
该数据集所应对的领域挑战在于非洲地区乙型肝炎免疫覆盖率的长期监测与跨国产出可比较性不足的问题。尽管WHO提供了统一指标代码WHS4_117,但各国报告数据的完整性、时间序列的连续性以及置信区间的可获得性差异显著,给区域层面的因果推断与趋势建模带来困难。在数据构建过程中,挑战同样严峻:原始API返回的数据包含多种维度类型(如性别、城乡),需通过复杂的维度过滤与聚合逻辑才能还原国家级覆盖率估计值;部分年份或国家的观测缺失,置信区间带(value_low/value_high)亦非完全覆盖,这对模型输入的准备提出了数据对齐和缺失处理的要求。此外,从非结构化字符串“value_display”中提取精确数值并保持与“NumericValue”字段的一致性,亦构成了数据清洗与质量控制的精细挑战。
常用场景
经典使用场景
在公共卫生与流行病学研究中,该数据集被广泛用于分析非洲地区1岁儿童乙型肝炎(HepB3)疫苗覆盖率的变化趋势。研究者常利用其时间序列结构(2000–2024年)和47个非洲国家的面板数据,构建回归模型或机器学习预测器,以探讨覆盖率随时间推移的演变规律,评估各国免疫规划的执行效能。
解决学术问题
该数据集有效解决了非洲地区免疫覆盖率长期缺乏标准化、可机读跨国数据的问题。学术上,它支持探究健康不平等、疫苗可及性与国家经济水平(如GDP)之间的关系,并通过置信区间量化统计不确定性,为政策干预效果评估和疾病传播建模(如HBV动态模型)提供了可靠的数据基础,对实现WHO全球免疫目标(如GVAP)具有重要推动意义。
衍生相关工作
该数据集衍生了一系列经典研究,包括利用LSTM或CNN对非洲乙型肝炎覆盖率进行长期预测的工作,以及将覆盖率作为协变量纳入HBV传播动力学模型(如SEIR框架)的流行病模拟。此外,它还催生了用于评估COVID-19对常规免疫服务中断影响的分析,以及基于时空地理加权回归(GTWR)探索覆盖率空间异质性的方法学改进研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作