five

electricsheepafrica/africa-who-number-of-reported-cases-of-poliomyelitis-by-wild-poliovirus

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-reported-cases-of-poliomyelitis-by-wild-poliovirus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标由野生脊髓灰质炎病毒(WPV)引起的脊髓灰质炎报告病例数在非洲国家的国家级观察数据,时间跨度为2016年至2023年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory的OData API获取,并重新打包为Parquet文件,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖47个非洲国家,总行数为376行。

This dataset contains country-level observations for the WHO GHO indicator Number of reported cases of poliomyelitis by wild poliovirus (WPV) across African nations, spanning 2016–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 376 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家在2016至2023年间由野生脊髓灰质炎病毒所致的脊髓灰质炎报告病例数。Electric Sheep Africa团队将原始数据重新整理为Parquet格式,并统一了数据架构。所有数值均从浮点精度的NumericValue字段提取,而非显示字符串,同时保留了置信区间上下限(value_low、value_high)。数据集涵盖47个非洲国家,共376条记录,每一条对应特定国家与年份的唯一观测值,无需考虑子维度分层。
特点
该数据集以机器学习就绪(ML-ready)为设计目标,采用一致且简洁的列式结构,包含指示符编码、国家ISO3代码、WHO区域、年份、数值估计及其置信区间、显示字符串及维度字段。其关键特点在于数据来源权威且经过标准化处理,无子维度分层使分析更为直接。此外,数据集附带了更新时间戳,便于追踪数据时效性,整体上为非洲区域脊髓灰质炎疫情监测与建模提供了高质量、可复用的基础数据。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据集,使用`load_dataset`函数即可获得训练集DataFrame。随后可依据维度字段进行筛选,例如保留dim1以'_BTSX'结尾或缺失的行,以获取全国男女合计的数据。亦可按国家ISO3代码(如KEN)过滤并排序年份,构建单一国家的时间序列。该数据集适用于分类或回归任务,支持流行病学趋势分析与预测建模,其简单的结构也便于直接集成到各类数据工作流中。
背景与挑战
背景概述
脊髓灰质炎(小儿麻痹症)作为一种严重威胁儿童健康的病毒性传染病,其全球根除行动一直是国际公共卫生领域的核心议题。该数据集由Electric Sheep Africa团队于2023年整理并发布,旨在整合世界卫生组织(WHO)全球卫生观察站(GHO)提供的非洲地区野生脊髓灰质炎病毒(WPV)确诊病例数据。数据集覆盖2016至2023年间47个非洲国家,包含376条观测记录,为量化非洲地区脊髓灰质炎消除进展提供了标准化、机器学习友好的数据资源。作为非洲统一数据仓库的一部分,该数据集填补了区域公共卫生时序数据分析的空白,有助于追踪免疫接种成效、监测病毒传播动态,并支持基于证据的防控决策。其发布对推动数据密集型流行病学研究、促进全球健康公平具有重要价值。
当前挑战
该数据集所解决的领域核心挑战在于:非洲地区脊髓灰质炎病例监测数据存在碎片化、统计口径不一及时间断点问题,传统分析方法难以有效揭示病毒传播规律与消除进展。构建过程中面临多重困难:首先,数据源WHO GHO的OData API返回结果需进行复杂清洗与模式统一,例如将不同年份、国家的原始字段(如NumericValue)转化为标准化的浮点精度值;其次,非洲国家医疗报告系统覆盖不均,导致部分年份或区域数据缺失严重,需谨慎处理空值以避免引入分析偏差;此外,置信区间边界字段(value_low、value_high)仅在部分观测中可用,进一步增加了模型训练时不确定性量化的难度。这些挑战共同要求数据集在设计时兼顾灵活性与鲁棒性,以支撑下游分类与回归任务。
常用场景
经典使用场景
自2016年至2023年间,非洲地区野生脊灰病毒所致脊髓灰质炎确诊病例的数量,构成了该数据集的核心指标。这一时间序列数据跨越全球根除脊髓灰质炎行动的关键阶段,能够支持研究者对非洲各国疫情态势进行纵向回顾与横向对比。数据集中包含47个非洲国家的年度报告病例数,并附有置信区间,为流行病学建模、疫情爆发预警以及疫苗干预效果评估提供了宝贵的基准数据集,尤其适用于时间序列预测和分类任务。
解决学术问题
该数据集直面全球公共卫生领域一个经典难题:如何系统量化并监测野生脊灰病毒在非洲大陆的传播谱系与区域异质性。通过提供标准化的、机器可读的年度病例统计,它使学界得以开展关于疫苗接种覆盖率与发病率动态关系的定量分析,并助力解析地理邻近性、人口流动等非生物学因素对病毒持续传播的影响。其意义在于为‘最后一公里’的病毒根除策略提供实证依据,推动从描述性流行病学向数据驱动的精准干预范式转变。
衍生相关工作
基于这份数据,学界已衍生出一系列具有影响力的研究工作。例如,研究人员利用其训练机器学习模型,根据历史发病模式预测未来疫情暴发热点;另有研究结合气候与社会经济指标,量化影响野病毒传播的环境驱动因素。这些工作不仅催生了针对非洲地区的新型传染病预测工具,还推动了基于时空统计模型的边缘传播动力学的理论发展,强调了高质量官方统计数据在构建可靠人工智能健康模型中的核心地位。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务