electricsheepafrica/africa-who-measles-number-of-reported-cases
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-measles-number-of-reported-cases
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“麻疹 - 报告病例数”(WHS3_62)在非洲国家的国家级观察数据,时间跨度为1974年至2024年。数据来源于WHO Global Health Observatory OData API,并以Parquet格式重新打包,具有一致的架构。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖47个非洲国家,总共有2,199行数据。
This dataset contains country-level observations for the WHO GHO indicator "Measles - number of reported cases" (`WHS3_62`) across African nations, spanning 1974–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的公开数据接口,经由Electric Sheep Africa项目进行系统化整合与重封装。原始数据通过OData API直接获取,所有观测值均采用浮点精度字段NumericValue而非显示字符串,确保了数值的精确性与一致性。数据以Parquet格式存储,并遵循统一的表结构模式,覆盖了1974年至2024年间47个非洲国家共计2,199条记录。数据集仅包含单一维度(国家与年份的组合),当指标按性别或居住地类型等分层时,每个独特的子维度组合作为独立行出现,便于精细筛选与分析。
特点
该数据集聚焦于非洲地区麻疹报告病例数的核心卫生指标(WHO代码WHS3_62),具有时间跨度长、覆盖范围广的显著优势。每一行数据对应特定国家特定年份的观测值,提供点估计值(value_numeric)作为主要机器学习目标,同时附带了置信区间上下界(value_low与value_high),为不确定性量化提供了基础。数据集中无缺失子维度,所有记录均经过WHO AFRO区域筛选,确保地域聚焦性。此外,数据集的标准化字段设计(如ISO国家代码、年份、指标代码)使其易于与其它非洲健康数据集进行联合分析。
使用方法
通过HuggingFace Datasets库即可便捷加载该数据集,调用`load_dataset("electricsheepafrica/africa-who-measles-number-of-reported-cases")`后,返回的数据集包含`train`子集,可直接转换为Pandas DataFrame进行后续分析。用户可通过过滤`dim1`字段(如筛选以`_BTSX`结尾的值)来获取全国范围、不分性别的汇总数据;按国家ISO代码(如`KEN`)与年份排序则可轻松构建任意非洲国家的时间序列。数据集支持时序预测、回归建模、分类任务及卫生政策评估等多种分析场景,同时也适合作为非洲区域健康数据微调预训练模型的监督学习输入。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)于2024年整理发布,并由Electric Sheep Africa机构重新封装,聚焦于非洲地区麻疹报告病例数的历史记录。作为全球公共卫生领域的关键指标,麻疹病例监测对于评估疫苗接种覆盖率、预警疫情暴发以及指导资源分配具有不可替代的作用。该数据集覆盖了1974年至2024年间47个非洲国家的年度报告数据,共计2199条观测,构成了非洲大陆迄今最为系统化的麻疹流行病学时间序列之一。其发布为研究非洲区域传染病动态、验证公共卫生干预效果以及构建区域健康预测模型提供了坚实的数据基础,对全球健康不平等研究和联合国可持续发展目标(SDG 3.3)的监测具有显著的学术和现实意义。
当前挑战
该数据集所面临的挑战首先体现在其领域问题层面:非洲地区麻疹报告病例的完整性与准确性长期受制于薄弱的卫生信息系统和低下的病例报告率,导致数据可能存在系统性低估和空间异质性。此外,时间序列中公共卫生干预(如大规模疫苗接种运动)的间断性与各国数据采集标准的差异,使得跨国家和跨年代的比较分析充满困难。在构建过程中,原始WHO数据需经过全球化ODATA接口的采集、多源格式的归一化及置信区间的筛选整合,面临数据缺失、异常值和时区更新同步等技术难题。同时,确保47个国家在长达50年跨度内的数据结构一致性和非文本书段的可复现性,也构成了工程部署层面的显著障碍。
常用场景
经典使用场景
非洲麻疹报告病例数数据集(africa-who-measles-number-of-reported-cases)源自世界卫生组织全球卫生观察站,覆盖1974年至2024年间47个非洲国家的年度疫情统计。该数据集最经典的使用场景在于构建时间序列预测模型,通过历史报告病例数的演变规律,对未来的疫情趋势进行前瞻性预估。研究者通常将其与气候、人口密度或疫苗接种覆盖率等协变量联合分析,以揭示麻疹传播的关键驱动因素。此外,该数据集也经常被用于区域比较研究,通过横截面数据分析不同非洲国家在疫情响应效能上的差异,为跨国卫生政策评估提供扎实的量化依据。
实际应用
在实际应用中,该数据集为非洲各国的公共卫生决策提供了关键情报支撑。通过监测历年报告病例数的波动,卫生部门能够及时识别疫情反弹的早期信号,从而启动预警机制,优化疫苗资源配置,并针对高风险区域实施精准干预措施。国际组织如WHO和联合国儿童基金会也将此类数据作为评估国家消除麻疹进展的核心指标,用于指导援助资金投放和跨国联合防控计划。此外,流行病学建模团队可基于该数据集开展模拟推演,测试不同疫苗接种覆盖率情景下疫情控制效果,为资源有限国家的科学决策提供清晰路径。
衍生相关工作
该数据集衍生了一系列影响深远的经典研究工作。在建模层面,研究者开发了基于贝叶斯结构时间序列的疫情预测框架,用于捕捉非洲大陆麻疹报告病例的年际波动模式;在因果推断领域,有学者利用该数据结合疫苗接种调查数据,评估了麻疹疫苗覆盖率提升对病例数下降的归因贡献。此外,该数据集还催生了若干综合性卫生数据库建设项目,例如部分团队将其整合进非洲卫生指标体系,用于构建多维度的疫情脆弱性指数。这些衍生工作不仅深化了对麻疹传播动力学的理解,也为其他传染病的监测建模提供了可迁移的方法论范例。
以上内容由遇见数据集搜集并总结生成



