electricsheepafrica/africa-who-number-of-indigenous-p-vivax-malaria-cases
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-indigenous-p-vivax-malaria-cases
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家2015年至2024年间世界卫生组织全球健康观察站(WHO GHO)指标本土P. vivax疟疾病例数(MALARIA_PV_INDIG)的国家级观察数据。它是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)系列的一部分——一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖了13个非洲国家,总共有50行数据,且没有子维度(每个国家/年份的单一值)。
This dataset contains country-level observations for the WHO GHO indicator Number of indigenous P. vivax malaria cases (MALARIA_PV_INDIG) across African nations, spanning 2015–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 13 African nations with a total of 50 rows and has no sub-dimensions (single value per country/year).
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织(WHO)全球卫生观察站(GHO)的OData API,聚焦于非洲国家间本地感染间日疟原虫疟疾病例数的统计指标(MALARIA_PV_INDIG)。通过系统化抓取GHO接口中的NumericValue字段,以浮点数形式精确提取点估计值,同时保留置信区间上下限数据。所有观测值按国家、年份及分层维度整理,并统一封装为Parquet文件格式,形成具备一致数据模式的机器学习就绪数据集。数据覆盖2015至2024年间13个非洲国家,共计50条记录,属于Electric Sheep Africa系列的一部分。
使用方法
用户可通过HuggingFace的datasets库便捷加载该数据集,调用load_dataset函数即可获取训练集。返回的数据可直接转换为Pandas DataFrame格式进行分析。建议使用过滤操作处理亚维度,例如通过检查dim1列是否以'_BTSX'结尾来提取两性均值的全国层面数据。对于单国时间序列分析,可依据country_iso3列筛选特定国家并按年份排序。数据集支持分类与回归两类任务,适用于公共卫生领域的建模与预测工作。
背景与挑战
背景概述
疟疾作为全球公共卫生领域的重大挑战,尤其在撒哈拉以南非洲地区造成了沉重的疾病负担。其中,间日疟原虫(Plasmodium vivax)因其独特的生物学特性,如休眠体的存在,使得根除工作尤为复杂。世界卫生组织(WHO)通过其全球卫生观察站(GHO)长期监测各成员国疟疾流行态势,于2024年发布了跨度为2015至2024年的非洲地区本土间日疟病例数指标(MALARIA_PV_INDIG)。该数据集由Electric Sheep Africa整理并封装为机器学习就绪格式,覆盖13个非洲国家,旨在为区域疟疾防控模型、流行病学时间序列分析以及循证政策评估提供高质量、标准化的数据基础,推动了非洲健康数据科学的发展。
当前挑战
该数据集所解决的领域核心挑战在于量化评估间日疟在非洲地区的真实传播强度与消除进展,克服了传统疾病监测中因诊断局限和报告系统不完善导致的数据碎片化与低估问题。在构建过程中,挑战主要源于对WHO GHO原始OData API返回的异构数据格式进行统一处理,需从多个嵌套字段中精确提取`NumericValue`作为数值目标,同时保留置信区间以支持不确定性建模。此外,不同国家间数据缺失模式、时间序列的非连续性以及维度(如性别、城乡)信息的稀疏性,要求在设计清晰的Schema时兼顾完整性与机器学习任务的便捷性,这无疑增加了数据清洗与预处理的复杂度。
常用场景
经典使用场景
该数据集汇聚了2015至2024年间非洲13个国家本土间日疟原虫(Plasmodium vivax)感染病例的官方统计,是区域疟疾流行病学研究中不可或缺的时序资料。在经典使用场景中,研究者可借助这些国家层面的年度观测值,构建宏观层面的疟疾流行趋势模型,评估各国在本土病例清零进程中的阶段性成果。数据集不仅提供了点估计值,还收录了置信区间边界,使得概率建模与不确定性量化成为可能,进而支持对干预措施效力的事后分析与区域内疫情异质性的比较研究。
解决学术问题
该数据集解决的学术问题聚焦于非洲大陆间日疟原虫本土病例的量化监测与时空动态解析。长期以来,学界对非洲间日疟的关注远低于恶性疟,致使其流行病学特征与防控策略评估存在显著数据缺口。此数据集填补了这一盲区,使研究者能够系统性地刻画间日疟在撒哈拉以南地区的真实负担,量化其与气候、经济发展及公共卫生投入的关联,并为世界卫生组织提出的疟疾消除目标提供可验证的基线数据与评价基准。
实际应用
在实际应用层面,该数据集可为非洲各国的公共卫生决策提供直接支撑。各国疾病控制机构可借助其中年度病例数及置信区间,动态评估国家疟疾控制计划的执行效果,识别疫情反弹的重点区域与时段,从而优化蚊媒消杀、药物分发及病例监测资源的配置。此外,国际卫生组织与非政府组织也可利用这些数据开展跨国比较,为跨境联防联控机制的制定与资金调配优先级的确立提供量化依据。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区间日疟原虫本地感染病例数的时空监测与机器学习可复现分析,为全球疟疾消除战略提供精细化数据支撑。随着世界卫生组织推动基于证据的疟疾防控决策,该数据集以标准化、机器友好的Parquet格式整合了13个非洲国家2015至2024年的年度观测值,填补了非洲疟疾流行病学中P. vivax感染数据的碎片化空白。当前前沿研究正利用此类高颗粒度时序数据,结合置信区间信息,构建预测模型以识别传播热点与干预优先级,同时探索环境社会经济协变量对复发风险的影响。这一资源不仅助力评估《全球疟疾技术战略》的阶段性成效,还通过开放许可促进跨国界协作,推动人工智能在公共卫生监测中的伦理应用,尤其对非洲大陆消除疟疾的本地化策略具有深远意义。
以上内容由遇见数据集搜集并总结生成



