five

electricsheepafrica/africa-who-number-of-malaria-cases-treated-with-artemisinin-based

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-malaria-cases-treated-with-artemisinin-based
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(GHO)指标“使用青蒿素联合疗法(ACTs)治疗的疟疾病例数量”(MALARIA_ACT_TREATED)在非洲国家的国家级别观察数据,时间跨度为2017年至2024年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来自WHO GHO OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Number of malaria cases treated with artemisinin-based combination therapies (ACTs)" (MALARIA_ACT_TREATED) across African nations, spanning 2017–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织(WHO)全球卫生观察站(GHO)的OData API,专注于非洲地区使用青蒿素联合疗法(ACTs)治疗的疟疾病例数量。原始数据经规范化处理后,以Parquet格式存储,并采用一致的数据模式进行重新封装。所有数值均提取自高精度的浮点型字段NumericValue,同时保留了可用的置信区间上下限。该数据集覆盖2017至2024年间45个非洲国家的年度观测数据,共计271条记录,所有观测均隶属于WHO非洲区(AFRO)。每个国家-年份组合对应一个唯一的数据点,不包含额外的分层维度。
特点
该数据集的核心特点在于其高度的结构化与即用性。所有字段均经过精心设计,包括指示码、国家ISO3代码、WHO区域、观测年份、核心数值及其置信区间等。数据以单值形式呈现,避免了复杂的分层结构,使得研究者能够直接聚焦于疟疾ACT治疗数量的时空趋势分析。此外,数据集的规模精炼,便于快速加载与初步探索,且兼容主流的机器学习工作流,特别适用于分类与回归任务的基线建模。
使用方法
用户可通过HuggingFace的datasets库便捷加载该数据集,例如使用`load_dataset`函数直接读取。加载后,数据可转换为Pandas DataFrame进行后续分析。默认情况下,数据集中包含所有性别与居住地类型的分层信息。若需获取全国性且无性别区分的宏观趋势,可通过过滤`dim1`字段中以`_BTSX`结尾或为空值的行来实现。针对特定国家的时序分析,则可依据`country_iso3`字段进行筛选,并利用`year`字段排序,从而构建完整的时间序列数据集。
背景与挑战
背景概述
在全球公共卫生领域,疟疾始终是威胁非洲大陆最为严峻的传染病之一,而青蒿素联合疗法(ACTs)作为目前最有效的抗疟药物,其使用情况的精准监测对于评估防治策略、优化资源配置具有不可替代的价值。世界卫生组织(WHO)全球卫生观察站(GHO)长期采集并发布各国疟疾治疗的关键指标数据,以支持循证决策。在此背景下,‘Africa — WHO GHO: Number of malaria cases treated with artemisinin-based combination therapies (ACTs)’数据集由Electric Sheep Africa团队于2024年基于WHO官方数据重新整理构建,聚焦于2017至2024年间45个非洲国家接受ACTs治疗的疟疾病例数量。该数据集的诞生有效弥合了原始WHO数据在机器学习和结构化分析场景下的使用鸿沟,为非洲疟疾负担评估、药物覆盖趋势分析及卫生政策模拟提供了统一、可直接调用的结构化数据基底,对推动数据驱动的全球健康研究具有显著的促进意义。
当前挑战
该数据集所应对的核心领域挑战在于,传统疟疾治疗监测数据多以分散的统计报告或非结构化表格呈现,难以直接运用于机器学习建模与大范围时间序列分析,从而限制了对抗疟药物覆盖率变化的实时洞察与预测能力。在构建过程中,团队面临着多重挑战:首先,从WHO GHO的OData API中提取数据时需处理不同年份、不同国家的报告口径差异,确保数据采集的完整性与一致性;其次,原始数据包含置信区间等多种字段,需精确提取浮点型数值而非显示字符串,并保留高低置信区间以供不确定性分析;最后,数据覆盖45个国家但仅有271条记录,样本量较小且国家间缺失值模式各异,需要在维持数据质量的前提下设计合理的清洗与整合策略,以保证下游模型训练的稳健性与可靠性。
常用场景
经典使用场景
该数据集专注于记录非洲各国在2017至2024年间使用青蒿素类联合疗法(ACTs)治疗疟疾的病例数量,源自世界卫生组织全球卫生观察站(WHO GHO)的官方数据。在疟疾防控领域,青蒿素类药物是当前最有效的一线抗疟方案,评估其覆盖率和治疗效果对于监测非洲大陆的公共卫生进展至关重要。数据集的经典使用场景包括对非洲国家ACT治疗覆盖率的纵向追踪、区域间差异的比较分析,以及将病例数作为核心标签,构建回归模型以预测未来疟疾治疗需求。其结构化的表格形式,包含置信区间等辅助信息,为流行病学研究提供了即时可用的机器学习训练数据。
实际应用
在实际应用层面,该数据集为公共卫生决策者和国际援助机构提供了可操作的洞见。例如,非政府组织(NGOs)可利用这些数据识别ACT治疗覆盖率低迷的区域,从而定向分配抗疟药物资源并加强医疗基础设施建设。各国卫生部门可结合本地疫情报告,用该数据集校准疟疾发病模型,评估现有治疗方案的效能。此外,世界卫生组织及其合作伙伴在制定区域疟疾消除路线图时,可依据这些病例数量指标监测阶段性成果,确保资金投放和干预策略与一线治疗需求精准匹配,最终减少非洲疟疾的总体负担。
衍生相关工作
围绕该数据集已衍生出多项标志性工作,这些工作共同推动了疟疾流行病学与数据科学的交叉融合。研究者通过加载该数据集中的时间序列信息,构建了泛非地区的疟疾治疗覆盖率基准线,并进一步与地理遥感数据(如气候、土地利用)关联,探索了环境因素对ACT治疗可及性的间接影响。部分经典工作聚焦于统计建模,利用该数据的结构型缺失值和置信区间,开发了贝叶斯层次模型以更准确地推断资源受限地区的治疗规模。此外,该数据集也被纳入‘非洲电力羊’项目(Electric Sheep Africa)的集成式数据库,为跨疾病、跨国家的非洲健康数据联合分析提供了范例,催生了多篇关于数据驱动型全球健康治理的综述性论文。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务