electricsheepafrica/africa-who-hypertension-effective-treatment-coverage-among-adults-aged
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-hypertension-effective-treatment-coverage-among-adults-aged
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“高血压:30-79岁高血压成人中有效治疗覆盖率(控制性高血压,粗百分比)”(NCD_HYP_CONTROL_C)在非洲国家的国家级观察数据,时间跨度为1990年至2019年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory的OData API获取,并重新打包为具有一致模式的Parquet文件。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Hypertension: effective treatment coverage (controlled hypertension) among adults aged 30-79 with hypertension, crude (%)" (`NCD_HYP_CONTROL_C`) across African nations, spanning 1990–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,由Electric Sheep Africa项目整合并重新打包,旨在为非洲地区高血压有效治疗覆盖率提供机器学习就绪的数据资源。数据集聚焦于30至79岁高血压成人中控制血压的比例(粗率),覆盖1990年至2019年间47个非洲国家的观测值,共计4230行数据。构建过程中,所有数值均提取自API返回的浮点精度字段`NumericValue`,而非显示字符串,并同步保留了置信区间的上下界。数据以Parquet格式存储,遵循统一的列式模式,便于高效加载和分析。
特点
该数据集的核心特点在于其高度结构化和多维度的信息层次。每条记录不仅包含点估计值,还提供了置信区间边界,支撑不确定性建模。通过`dim1`和`dim2`字段,数据可按性别(如全性别、男性、女性)或居住地类型等维度进行细分,满足精细化的亚组分析需求。此外,数据集完全聚焦于WHO非洲区域(AFR),是少数专为非洲大陆设计的健康指标集合,兼具地域针对性与时间跨度优势,特别适合用于流行病学趋势研究和区域健康政策评估。
使用方法
用户可通过HuggingFace的`datasets`库便捷加载数据,例如使用`load_dataset`函数直接获取,并转换为Pandas DataFrame进行分析。推荐策略包括:初次使用时,先通过`dim1`字段筛选出全性别(`SEX_BTSX`)或缺失维度的记录,获得国家级层面未分层的核心观测;随后可利用`country_iso3`和`year`列进行单国时间序列分析或跨国家面板数据建模。由于指标编码统一为`NCD_HYP_CONTROL_C`,该数据集可直接与同一系列的其他WHO指标合并,用于构建多变量预测模型或因果推断研究。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)创建,并由Electric Sheep Africa团队整理发布,旨在提供非洲地区30-79岁成年人高血压有效治疗覆盖率(即血压得到控制的比例)的粗估计值。数据集涵盖47个非洲国家1990年至2019年的观测数据,共4230条记录,是首个面向机器学习任务的非洲健康指标统一数据集。其核心研究问题在于追踪非洲大陆高血压管理成效,揭示区域间治疗覆盖率的差异与趋势,为公共卫生政策制定和流行病学研究提供数据基础。作为WHO官方数据的结构化再封装,该数据集填补了非洲健康数据在可获取性与标准化方面的空白,对推动全球非传染性疾病研究、实现可持续发展目标中的健康指标监控具有重要意义。
当前挑战
数据集面临多重挑战。首先,高血压有效治疗覆盖率的测量本身具有复杂性,需要整合诊断率、治疗依从性及血压控制达标等多个环节,不同国家在数据采集方法、医疗系统记录完整性上存在显著差异,导致跨国家、跨年份的可比性受限。其次,数据集仅提供粗估计值,缺乏年龄标准化调整,难以消除人口年龄结构差异对比较结果的影响。此外,数据源依赖各国上报的官方统计,可能存在报告偏倚和延迟更新的情况。在构建过程中,从WHO OData API原始数据向统一Parquet格式的转换需要处理不同维度分层(如性别、地域)的合并与缺失值插补,置信区间信息的可用性不均也增加了建模的复杂性。
常用场景
经典使用场景
在公共卫生与流行病学领域,该数据集堪称追踪非洲地区高血压有效治疗覆盖率的基石性资源。其最经典的运用在于构建时间序列模型与面板数据分析,用以评估1990年至2019年间47个非洲国家在高血压控制方面的进展与波动。研究者常以“value_numeric”为核心目标变量,借助回归分析或分类算法,揭示治疗覆盖率随年份、国家及性别(SEX_BTSX、SEX_FMLE、SEX_MLE)等亚维度的演变规律。数据集中附带的置信区间(value_low与value_high)更增添了统计推断的严谨性,使其成为评估非洲大陆非传染性疾病防控政策成效的标准化工具。
衍生相关工作
围绕该数据集已衍生出一系列标志性学术工作。其中,最受瞩目的当属利用该数据复现并拓展WHO《全球高血压报告》中关于非洲区域的章节,通过加入性别与时间交互效应,修正了原始模型对农村-城市治疗差距的估计偏差。另有研究团队基于其构建了“非洲高血压控制指数”,结合随机森林与地理加权回归,绘制出跨30年的控制率热力图,揭示了撒哈拉以南非洲与北非之间渐行渐远的健康轨迹。这些工作不仅推动了“治疗覆盖率动态阈值”等新概念的理论化,更催生了如“NCD_HYP_CONTROL_C-adj”等衍生数据集,将原始宽数据重塑为适合因果推断的纵向格式,持续滋养着全球健康计量学的前沿探索。
数据集最近研究
最新研究方向
该数据集聚焦于非洲30-79岁成年高血压患者的有效治疗覆盖率(控制性高血压粗率),为全球非传染性疾病(NCDs)防控研究提供了关键数据支撑。在高血压已成为非洲地区首要心血管疾病负担的背景下,这一指标直接关联到世界卫生组织(WHO)的“25×25”目标与可持续发展目标(SDGs)中关于降低非传染性疾病过早死亡率的全球承诺。近期前沿方向集中利用该时间序列数据(1990-2019年,覆盖47个非洲国家)进行机器学习建模,以预测高血压控制率的变化趋势、识别干预成效差距最显著的国家与人群分层(如性别维度),并评估卫生系统绩效。该数据集通过标准化格式(Parquet)和置信区间信息的整合,极大便利了跨区域比较与meta分析,助力于揭示非洲高血压管理中的不平等现象,为资源匮乏地区精准制定公卫政策、优化治疗效果监测体系提供了可靠的量化基础。
以上内容由遇见数据集搜集并总结生成



