electricsheepafrica/africa-who-reported-number-of-people-requiring-interventions-against
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-reported-number-of-people-requiring-interventions-against
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了世界卫生组织全球健康观察站(WHO GHO)指标需要针对NTDs(被忽视的热带病)进行干预的报告人数(SDGNTDTREATMENT)在非洲国家的国家级观察数据,时间跨度为2010年至2024年。这是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有数值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了47个非洲国家,总行数为705行,并且仅限于WHO AFRO地区(ParentLocationCode = AFR)。
This dataset contains country-level observations for the WHO GHO indicator Reported number of people requiring interventions against NTDs (SDGNTDTREATMENT) across African nations, spanning 2010–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 705 rows and is filtered to the WHO AFRO region (ParentLocationCode = AFR).
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲区域各国2010至2024年间因被忽视热带病(NTDs)而需干预的人口数量报告。数据以Parquet格式封装,采用统一架构,所有数值均取自高精度的浮点型字段NumericValue,并附带了置信区间上下限(value_low与value_high)。该过程由Electric Sheep Africa团队完成重构,使之成为适用于机器学习模型的标准化数据集。
特点
数据集涵盖47个非洲国家,共计705条观测记录,每个国家-年份组合对应一个唯一的数值,无额外子维度分层。其特色在于数据结构简洁明了,包含indicator_code、country_iso3、who_region、year、value_numeric等核心字段,以及维度类型与取值字段(dim1_type、dim1),便于用户根据性别、居住地类型等维度进行筛选。此外,数据遵循CC BY 4.0许可协议,确保了开放性与可用性。
使用方法
用户可通过HuggingFace的datasets库直接加载该数据集,使用load_dataset函数获取训练集DataFrame。为聚焦于全国层面且性别均衡的观测值,可通过筛选dim1列终止于'_BTSX'或缺失值的条目实现。进一步地,对特定国家的时间序列分析,可按country_iso3过滤后依年份排序。该数据集适用于分类与回归任务,为非洲地区NTDs干预需求的空间与时间动态分析提供了可靠素材。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)和Electric Sheep Africa联合整理,发布于2024年,聚焦于非洲47个国家2010至2024年间需要干预的被忽视热带病(NTDs)患者报告人数。核心研究问题在于量化非洲地区NTDs的疾病负担,为公共卫生资源分配与SDG目标监测提供数据支撑。作为WHO全球卫生观察站(GHO)的衍生数据产品,该数据集被整合为统一、机器学习就绪的格式,显著提升了非洲健康数据的可及性与分析效率,对流行病学建模、干预政策评估及可持续发展目标(SDG 3.3)的进展追踪具有重要影响力。其结构化设计为跨国家、跨时间序列的比较研究奠定了坚实基础。
当前挑战
该数据集面临的挑战首先体现在领域问题层面:NTDs在非洲的分布具有地域性、隐匿性和多病种共存的复杂性,而该指标仅提供国家层面的汇总数据,缺乏按年龄、性别、城乡或特定病种(如血吸虫病、淋巴丝虫病)的细分,导致无法精准刻画疾病传播的局部异质性与高危人群。在构建过程中,数据来源仅为WHO OData API的单一接口,可能面临部分国家漏报、报告标准不一致或历史数据断点等固有限制;同时,缺失值(如置信区间)和维度聚合(仅含国家级无亚组)的预设降低了模型的可解释性与适用灵活性,增加了在区域级或脆弱群体间准确推断的难度。
常用场景
经典使用场景
在非洲公共卫生与全球健康治理研究领域,该数据集为分析被忽视热带病干预需求提供了标准化的时间序列数据。研究者可据此构建面板数据模型,追踪47个非洲国家在2010至2024年间每年需要接受NTDs干预的人数变化趋势,从而评估疾病负担的时空演变格局。基于一致的数据模式,该数据集支持进行国家间横向对比、区域聚类分析及干预覆盖率的时间序列预测,是开展非洲NTDs流行病学研究和健康政策评估的基础性资源。
实际应用
在实际应用中,该数据集为世界卫生组织及各国卫生部门监测非洲NTDs防治进展提供了量化依据。决策者可基于历史数据评估特定干预措施(如大规模药物给药、病例管理)覆盖人群是否达标,进而调整资源分配计划。同时,非营利组织和研究机构可利用该数据集训练机器学习模型,预测未来干预需求升高的国家和地区,实现有限医疗资源的精准投放,提升区域健康公平性。
衍生相关工作
基于该数据集,研究者已衍生出一系列关键工作:包括构建非洲NTDs干预需求的高精度回归预测模型,探索社会经济与环境因素(如城镇化率、卫生设施可及性)对干预人数的非线性影响;开发跨国家时空插值方法以填补缺失年份的观测值;以及将本数据集与WHO其他健康指标(如疟疾发病率、基本药物可及性)关联,构建多维度健康脆弱性指数。这些工作深化了对非洲NTDs复杂驱动因素的理解,并为全球健康科学提供了公开、可复现的方法论范例。
以上内容由遇见数据集搜集并总结生成



