five

electricsheepafrica/africa-who-number-of-malaria-cases-treated-with-any-first-line-tx

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-malaria-cases-treated-with-any-first-line-tx
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2017-2024年间使用一线治疗(包括青蒿素为基础的联合疗法)治疗的疟疾病例数量的观测数据,是世界卫生组织全球健康观察指标的一部分。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。该数据集是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator "Number of malaria cases treated with any first  line tx courses (including artemisinin-based combination therapies (ACTs))" (`MALARIA_1STLINE_TREATED`) across African nations, spanning 2017–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区采用一线治疗方案(含青蒿素联合疗法)治疗的疟疾病例数量。数据经过系统化清洗与重构,以Parquet文件格式统一存储,所有数值均直接提取自高精度浮点型字段NumericValue,而非显示字符串,同时保留置信区间上下界(value_low与value_high)以增强统计可靠性。数据覆盖2017至2024年间45个非洲国家,共计270条国家-年份观测记录,地域限定于WHO非洲区域(ParentLocationCode='AFR'),且该指标无子维度分层,确保每个国家-年份组合对应单一数值,便于直接用于机器学习建模。
使用方法
使用该数据集时,可通过HuggingFace的datasets库直接加载,代码简洁高效。例如,load_dataset('electricsheepafrica/africa-who-number-of-malaria-cases-treated-with-any-first-line-tx')即可获取训练集,并轻松转换为pandas DataFrame进行后续处理。对于跨性别或区域的分析,可依据dim1字段过滤,例如筛选以'_BTSX'结尾的行为两性全国数据,或处理缺失值以保留全局统计。时间序列分析尤为便捷,只需按country_iso3分组后按year排序即可提取单个国家的趋势,例如kenya = df[df['country_iso3']=='KEN'].sort_values('year')。数据集引用与许可信息已明确标注,支持CC BY 4.0协议,确保学术使用合规性。
背景与挑战
背景概述
全球疟疾防控是公共卫生领域的重大挑战,尤其是撒哈拉以南非洲地区,承载着全球90%以上的疟疾病例负担。世界卫生组织全球卫生观察站(WHO GHO)自2017年起系统追踪非洲各国以青蒿素为基础的联合疗法(ACTs)等一线治疗方案覆盖的疟疾病例数量,该指标(MALARIA_1STLINE_TREATED)成为评估抗疟干预效能的核心基准。此数据集由Electric Sheep Africa机构于2024年整理发布,整合了45个非洲国家、覆盖2017至2024年的观测数据,总计270条记录,为机器学习驱动的区域卫生政策分析提供了标准化、高质量的时间序列基础,对量化治疗可及性、监测耐药性演变趋势及优化资源配置具有显著影响力。
当前挑战
该领域面临的挑战包括:1)疟疾治疗覆盖率的准确估算受限于脆弱卫生系统的报告能力不足、数据缺失与延迟,可能掩盖真实治疗缺口,尤其在农村与冲突地区;2)数据集仅提供逐年国家层面聚合值,缺乏年龄、性别、城乡等分层细粒度信息,无法细致解析弱势群体的治疗可及性差异。在构建过程中,原始数据从WHO OData API抽取后需处理多源格式不一致、置信区间缺失及维度字段混杂等问题,同时确保跨年跨国数据的可比性,最终转换为统一Parquet架构的清洗过程要求严谨的异常值校验与标准化协议,以维护机器学习就绪数据的可靠性。
常用场景
经典使用场景
在非洲公共卫生与流行病学研究中,该数据集作为定量分析的基础资源,广泛应用于对一线抗疟治疗方案覆盖情况的纵向评估。研究者可利用其国家-年份级别的观测值,结合置信区间信息,开展时间序列趋势分析、地区间治疗可及性对比,以及疟疾控制策略效果的回顾性评价。数据集规范的表格结构使其能够无缝融入机器学习流程,既可作为回归任务的连续值预测目标,也可经阈值设定转化为分类标签,适用于监督学习模型对治疗覆盖水平的建模与推断。
解决学术问题
该数据集核心回应了非洲疟疾防控领域长期存在的精准量化缺口,解决了传统报告数据粒度粗、缺乏统一结构化格式的问题。通过提供标准化的数值记录与置信区间,学术研究者得以克服数据碎片化障碍,系统探究一线治疗药物(尤其是青蒿素联合疗法)覆盖率的时空演变规律及其与疟疾发病率的耦合关系。其发布促进了跨国家、跨机构的数据复用与比较研究,为验证公共卫生干预效果、揭示治疗服务不均等性贡献了关键实证支持,提升了建模研究的可重复性与科学严谨性。
实际应用
在实际应用中,该数据集为非洲各国卫生部、WHO区域办公室及非政府组织提供数据驱动的决策依据。公共卫生管理人员可将其集成至监测仪表盘,动态追踪各国治疗覆盖进展,识别覆盖薄弱地区并优化药品采购与分发策略。数据科学家亦可将其注入预警系统,结合气象、人口流动等多源数据,预测未来治疗需求高峰,指导抗疟资源的精准投放。此外,该数据集对青蒿素联合疗法的侧重,有助于评估耐青蒿素疟原虫扩散对现有治疗体系的冲击,支撑治疗指南的及时修订。
数据集最近研究
最新研究方向
在全球公共卫生领域,非洲作为疟疾负担最沉重的地区,其一线治疗药物的覆盖情况始终是国际社会关注的焦点。该数据集聚焦于世界卫生组织全球卫生观察站(GHO)核心指标——经一线治疗方案(含青蒿素联合疗法)治疗的疟疾病例数量,覆盖2017至2024年间45个非洲国家的年度观测值,为科研人员提供了时间序列完整、空间维度清晰的跨国家面板数据。在青蒿素耐药性扩散与COVID-19疫情冲击卫生系统的双重背景下,该数据集助力学者精准量化各国抗疟干预成效,追踪治疗可及性的动态变化,驱动基于时空统计模型的治疗覆盖缺口识别研究,并支持结合气候、虫媒等协变量开展多因素驱动力分析,为《全球疟疾技术战略》的阶段性评估与资源优化配置提供坚实的数据基石,彰显了开放数据在非洲公共卫生循证决策中的变革性价值。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务