electricsheepafrica/africa-who-hypertension-treatment-coverage-among-adults-aged-30-79-treatmentc
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-hypertension-treatment-coverage-among-adults-aged-30-79-treatmentc
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“30-79岁高血压患者治疗覆盖率(%)”在非洲国家的国家级观察数据,时间跨度为1990年至2019年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO GHO OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Hypertension treatment coverage among adults aged 30-79 with hypertension, crude (%)" (`NCD_HYP_TREATMENT_C`) across African nations, spanning 1990–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦非洲地区30至79岁高血压成人的治疗覆盖率(粗率)。Electric Sheep Africa团队对原始数据进行了系统化重构,以Parquet格式保存,并采用一致的列式架构。数据包含47个非洲国家1990至2019年间共计4230条观测记录,所有数值均取自浮点精度的`NumericValue`字段,而非显示字符串。对于存在分层的指标(如按性别或居住地区划分),每个国家、年份与维度的独特组合生成独立行,同时提供置信区间上下限(`value_low`、`value_high`)以增强数据可靠性。
特点
本数据集的核心特色在于其面向机器学习优化的统一性与完整性。所有记录均来自WHO AFRO区域(`ParentLocationCode = 'AFR'`),覆盖47个非洲国家,时间跨度长达三十年。数据模式清晰,包含`indicator_code`、`country_iso3`、`year`、`value_numeric`等关键字段,并支持通过`dim1`与`dim2`维度进行亚组分析,如性别(SEX_BTSX、SEX_FMLE、SEX_MLE)或居住地区类型。置信区间字段的保留为不确定度量化提供了便利,而`last_updated`时间戳则确保数据溯源的可追溯性。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据集,调用`load_dataset`函数即可获取训练集,继而利用`.to_pandas()`方法转换为Pandas DataFrame进行深入分析。针对分析需求,可通过过滤`dim1`字段筛选双性(`_BTSX`)或全国层面数据,或按国家代码(如`country_iso3 == 'KEN'`)提取特定国家的时间序列。数据集适用于分类与回归任务,尤其适合研究非洲高血压治疗覆盖率的时空变化趋势及影响因素。
背景与挑战
背景概述
高血压作为全球非传染性疾病的首要致死风险因素之一,其治疗覆盖率的精准评估对于公共卫生政策制定与资源分配至关重要。世界卫生组织(WHO)全球卫生观察站(GHO)于2019年前后发布了一项关键指标——NCD_HYP_TREATMENT_C,用于量化30-79岁高血压成年人群的粗治疗覆盖率。由Electric Sheep Africa团队整合并重新打包的该数据集,涵盖了1990年至2019年间47个非洲国家的4230条观测记录,为机器学习研究提供了统一、高质量的结构化数据源。该数据集不仅填补了非洲地区高血压治疗领域系统性数据的空白,更推动了以数据驱动的区域健康不平等分析与预测建模的进展,对全球健康监测与可持续发展目标的实现具有深远影响。
当前挑战
当前数据集面临多重挑战。首先,在领域问题层面,高血压治疗覆盖率的时空差异性极大,且受限于非洲国家脆弱的医疗报告系统与数据收集能力,原始数据可能存在采样偏差与缺失值问题,使得模型难以准确捕捉真实治疗动态。其次,在构建过程中,数据来源为WHO GHO的ODA API接口,需处理不同年份、性别和居住地类型(如农村/城市)的分层信息,确保跨维度的一致性与可聚合性;同时,置信区间上下限(value_low/value_high)的稀疏分布增加了特征工程与不确定性量化的复杂性。此外,47个国家间医疗政策与诊断标准的非标准化,进一步提升了跨区域可比性与模型泛化的难度。
常用场景
经典使用场景
在非传染性疾病流行病学与全球卫生治理研究中,该数据集被广泛用于评估非洲地区高血压治疗覆盖率的时空演变格局。研究者常通过性別分层分析(男女分众及跨性别综合)与时间序列建模,揭示1990至2019年间47个非洲国家在控制高血压这一关键心血管风险因素上的治疗可及性动态变化。其精准的粗率指标为跨国比较和区域卫生政策效果量化提供了坚实的数据基底,尤其适用于探索治疗覆盖差异与卫生系统承载力、经济发展水平之间的内在关联。
解决学术问题
该数据集有效填补了非洲大陆高血压治疗覆盖纵向证据的系统性空白,解决了以往研究因数据碎片化、年代跨度有限而难以开展跨国家、跨年代宏观比较的难题。通过提供带有置信区间的标准化指标,它支撑了治疗不平等归因分析、卫生系统绩效评估以及千年发展目标/可持续发展目标健康指标的追踪验证。这些学术产出深化了对非洲非传染性疾病应对能力的理解,推动了全球健康指标监测方法论的标准化进程。
衍生相关工作
基于该数据集催生了一系列衍生研究,包括融合气候、城镇化等环境因素的多源数据集成分析,以及运用贝叶斯层级模型对缺失年份进行回溯性估算的工作。部分学者将其与血压测量调查研究联用以构建治疗缺口模型,另有团队基于该数据开发了面向非洲的高血压治疗覆盖预测算法,并通过开源工具包实现指标可视化与异常值自动检测。这些衍生工作不仅拓展了原始数据的应用边界,还反哺了全球健康数据科学的生态建设。
以上内容由遇见数据集搜集并总结生成



