five

electricsheepafrica/africa-who-neonates-protected-at-birth-against-neonatal-tetanus

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-neonates-protected-at-birth-against-neonatal-tetanus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标新生儿出生时免受新生儿破伤风保护率(PAB)百分比(WHS4_128)在非洲国家的国家级观察数据,时间跨度为2000年至2022年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Neonates protected at birth against neonatal tetanus (PAB) (%) (WHS4_128) across African nations, spanning 2000–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站的开源OData API,聚焦非洲地区新生儿在出生时免受新生儿破伤风感染的比例(PAB),对应指标编码WHS4_128。原始数据经重新包装为Parquet格式,统一采用一致性架构,所有数值均从NumericValue浮点精度字段提取,而非展示字符串。对于具备置信区间的观测值,数据集亦纳入了上下界标记。涵盖2000年至2022年间47个非洲国家的共1064条观测记录,严格限定于WHO非洲区域。
特点
数据集以国家-年份为基本粒度,每条记录对应单一指标取值,未包含子维度分层,因此数据简洁且便于直接用于时间序列与跨国家比较。结构包含indicator_code、country_iso3、who_region、year等关键字段,核心目标变量value_numeric提供连续浮点数值,辅以value_low和value_high置信区间字段增强不确定性信息的可用性。数据以Parquet列式存储,兼具高效压缩与机器学习友好特性。
使用方法
推荐通过HuggingFace datasets库加载,调用load_dataset直接获得训练集格式的Pandas DataFrame。如需获取不区分性别的全国层面数据,可过滤dim1列中以_BTSX结尾或为空的行。对于特定国家的时间序列分析,例如肯尼亚,可通过country_iso3筛选并依year排序。数据集支持表格分类与回归任务,适合用于预测建模、趋势分析及卫生政策评估相关的机器学习工作流。
背景与挑战
背景概述
新生儿破伤风是一种高致死率的感染性疾病,尤其在医疗资源匮乏的撒哈拉以南非洲地区构成严重公共卫生威胁。为监测全球消除进展,世界卫生组织(WHO)自2000年起通过全球卫生观察站(GHO)系统收集“出生时受破伤风保护的新生儿比例(PAB)”指标。该数据集由Electric Sheep Africa团队于2022年整合自WHO的OData API,覆盖47个非洲国家2000–2022年间共1064条观测记录,旨在为机器学习驱动的非洲健康监测提供标准化、可直接使用的结构化数据。其发布填补了非洲新生儿免疫覆盖高质量开放数据的空白,支持循证决策与区域间比对,对评估全球消除新生儿破伤风目标的阶段性成果具有重要参考价值。
当前挑战
该数据集所解决的领域核心挑战在于:新生儿破伤风预防依赖可靠及时的免疫覆盖率监测,但非洲许多国家长期面临数据稀疏、报告滞后与统计口径不一致的问题,传统方法难以实现跨时空的精准趋势评估。构建过程中面临多重挑战:首先,原始WHO数据经OData API返回后需清洗异构字段(如将显示字符串与数值标识对齐),并统一缺失置信区间边界的处理逻辑;其次,不同国家历年数据存在维度分层(性别、城乡等),需设计合理筛选策略以避免混淆总体估计;最后,47国数据的时间序列跨度长达23年,需保证跨域合并时无国家代码或年份格式冲突,同时维持Parquet格式的高效存取性能。
常用场景
经典使用场景
在全球公共卫生监测的宏观叙事中,该数据集常被用于追踪非洲各国新生儿破伤风保护率的历史演变轨迹。研究者可借助其覆盖47个国家、跨越2000至2022年的面板数据,构建时间序列模型或进行横截面比较,以评估免疫接种覆盖率的动态变化。其结构化的数值字段与置信区间信息,尤其适合作为监督学习中的回归目标变量或分类阈值判定的基准。
衍生相关工作
该数据集作为非洲健康数据统一汇集的代表性成果,已衍生出多项经典工作。研究者基于其标准化的模式,开发了跨指标融合分析框架,关联麻疹、百白破等其他疫苗覆盖数据以构建综合免疫脆弱性指数。同时,它常被用作迁移学习或低资源场景下时间序列预测的基准数据集,用于验证模型在稀疏区域上的泛化能力,推动了AI在公共卫生监测中的前沿探索。
数据集最近研究
最新研究方向
该数据集聚焦于非洲新生儿破伤风出生保护率(PAB)的纵向研究,结合世界卫生组织全球卫生观察站(GHO)的官方数据,为机器学习驱动的公共卫生评估提供了标准化、可复用的基础。当前前沿方向涵盖利用时序预测模型分析2000至2022年间47个非洲国家的保护率演变趋势,探究疫苗接种覆盖率与区域卫生政策效能的关联,并支持对贫困地区新生儿死亡率的因果推断。数据集的高质量置信区间与结构化元数据,使其成为评估非洲免疫规划成效、识别医疗资源薄弱地区的核心工具,尤其在应对全球消除新生儿破伤风目标的背景下,为数据驱动的健康干预策略优化与跨国家比较研究奠定了关键基础。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务