five

electricsheepafrica/africa-who-polio-immunization-coverage-among-one-year-olds

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-polio-immunization-coverage-among-one-year-olds
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“一岁儿童脊髓灰质炎免疫覆盖率(%)”(`vpolio`)在非洲国家的国家级观察数据,时间跨度为1993年至2019年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator "Polio immunization coverage among one-year-olds (%)" (`vpolio`) across African nations, spanning 1993–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,聚焦非洲地区一岁儿童脊灰免疫覆盖率这一核心健康指标。研究者通过自动化抽取API中的NumericValue字段,剔除了显示字符串的冗余信息,并将数据整合为统一的Parquet文件格式,确保各记录均包含浮点精度的数值。数据覆盖1993年至2019年间41个非洲国家,共计6020条观测记录,每条记录对应特定国家与年份的组合。同时,数据集允许用户根据年龄组、教育水平、居住地类型、性别及财富分位数等子维度进行筛选,为深入分析提供了分层结构。
特点
该数据集的核心特点在于其多维度分层结构与机器学习友好型设计。除了脊灰免疫覆盖率的标准点估计值外,还附带了置信区间的上下界,增强了统计推断的可靠性。数据按性别、年龄组、教育程度、城乡类型和财富等级等关键社会人口学变量进行细分,使用户能够探索免疫覆盖率的异质性。此外,数据集包含统一的字段架构和明确的ISO国家代码,便于跨区域整合与时间序列分析,同时依托WHO官方数据源,保证了较高的权威性和时效性。
使用方法
用户可通过HuggingFace的datasets库轻松加载该数据集,将其转换为Pandas DataFrame进行后续分析。推荐做法是首先过滤出全国层面或性别综合的数据,以获取宏观趋势,例如筛选dim1字段以保留仅含_BTSX后缀的记录。针对特定国家的时间序列研究,可依据country_iso3列进行筛选,并按年份排序。该数据集既适用于分类任务也适用于回归建模,可直接将value_numeric列作为目标变量,利用其丰富的特征维度开展预测或相关性分析。
背景与挑战
背景概述
脊髓灰质炎(polio)是一种严重威胁儿童健康的急性传染病,全球范围内持续强化免疫覆盖是根除该病的核心策略。在此背景下,世界卫生组织(WHO)全球卫生观察站(GHO)发布了关于非洲地区一岁儿童脊髓灰质炎免疫覆盖率(vpolio)的指标数据集。该数据集由Electric Sheep Africa团队整理,收录了1993年至2019年间41个非洲国家的6,020条观测记录,数据来源为WHO官方OData API,采用CC BY 4.0许可协议开放共享。作为面向机器学习的非洲统一数据仓库的一部分,该数据集聚焦于非洲区域(WHO AFRO),核心研究问题在于量化不同社会人口和经济维度下脊髓灰质炎疫苗的接种进展,从而为公共卫生政策制定和疾病根除监测提供精确的数据基础。其在全球卫生数据科学领域具有重要影响力,尤其推动了非洲地区健康指标的标准化和可重复性研究。
当前挑战
该数据集所解决的领域核心挑战在于,脊髓灰质炎免疫覆盖率的精确评估面临多重障碍:一方面,非洲各国卫生系统数据采集能力不均,传统统计往往受限于缺失值、报告延迟及行政划分差异;另一方面,免疫指标常受年龄组、居住地类型(城市/农村)、性别、教育水平和财富阶层等社会分层因素影响,若不加区分则易掩盖健康不平等现象。在构建过程中,主要挑战包括从WHO API中提取并整合多维度元数据(如AGE GROUP、SEX、WEALTH QUINTILE等),确保跨年份和国别的数据格式统一,同时筛选出数值精度字段(NumericValue)而非显示字符串,并保留置信区间(value_low/value_high)以支持统计推断。此外,处理不同分层组合带来的数据稀疏性和重复行问题,以及维持与全球健康数据标准(如ISO 3166国家代码、WHO区域编码)的严格对齐,亦是构建中的关键难点。
常用场景
经典使用场景
在全球公共卫生领域,脊髓灰质炎(脊灰)免疫接种覆盖率是衡量一个国家免疫规划成效的关键指标。该数据集汇集了1993至2019年间41个非洲国家的脊灰疫苗接种率年度数据,并细化了性别、年龄组、居住地类型、教育水平和财富水平等多个亚组维度。研究者和公共卫生分析师常利用此数据集进行时间序列分析、跨区域比较以及不平等性评估,以揭示疫苗接种覆盖率的动态变化及其背后的社会人口学因素。
衍生相关工作
基于该数据集,已衍生出多项经典的学术研究与实践工作。例如,研究者利用其亚组数据构建了贝叶斯分层模型,以估算未覆盖儿童的空间分布;另有工作结合DHS调查数据,分析财富指数与接种完成率之间的非线性关系。此外,该数据集常被用作机器学习训练集,开发预测模型来模拟不同干预情景下接种率的提升路径,为政策模拟和成本效益分析提供了坚实的数据基础。
数据集最近研究
最新研究方向
在全球根除脊髓灰质炎的攻坚阶段,非洲大陆的免疫覆盖率数据成为评估干预成效与识别防控盲区的核心依据。该数据集聚合了1993年至2019年间41个非洲国家的脊灰疫苗接种率信息,并融入了年龄、性别、城乡、教育水平及财富分位数等多维度分层变量,为构建预测性流行病学模型、识别免疫不平等的社会决定因素提供了高质量的机器学习就绪样本。当前前沿研究正借助此类细粒度时间序列数据,训练因果推断模型以量化冲突与卫生系统韧性对接种覆盖率的冲击,并利用时空归因框架揭示特定区域覆盖率反弹的驱动因子。数据集与WHO全球卫生观测站的官方接口对齐,置信区间的引入更增强了统计建模的稳健性,为制定精准补种策略与评估全球免疫议程进展夯实了数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作