five

electricsheepafrica/africa-who-hypertension-treatment-coverage-among-adults-aged-30-79-treatmenta

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-hypertension-treatment-coverage-among-adults-aged-30-79-treatmenta
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标30-79岁高血压患者的高血压治疗覆盖率(年龄标准化%)在非洲国家的国家级观察数据,时间跨度为1990年至2019年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Hypertension treatment coverage among adults aged 30-79 with hypertension, age-standardized (%) across African nations, spanning 1990–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,聚焦非洲地区高血压治疗覆盖率这一关键公共卫生指标。研究团队通过OData API系统性地抓取原始数值型观测数据,并以Parquet格式进行标准化封装,确保数据结构的统一性与机器学习就绪性。数据集涵盖1990年至2019年间47个非洲国家的国家层面观察记录,共计4230行数据。每条记录均包含点估计值、置信区间上下界及元数据字段,缺失值以空值保留,从而保证数据完整性与后续分析灵活性。
使用方法
使用者可通过HuggingFace的datasets库便捷加载数据,返回的DataFrame格式与主流科学计算生态无缝衔接。建议在建模前利用'dim1'字段筛选所需性别分层(如以'_BTSX'结尾的两性合计数据),并依据'country_iso3'与'year'字段构建国家时间序列。对于需要预测任务的场景,可直接将'value_numeric'作为回归目标变量,而分类任务则可基于阈值对覆盖率进行离散化处理。数据集中'value_low'与'value_high'字段也可用于构建区间估计模型或进行不确定性感知学习。
背景与挑战
背景概述
在全球非传染性疾病负担日益沉重的背景下,高血压作为心血管疾病的主要危险因素,其治疗覆盖率成为评估公共卫生系统效能的关键指标。由世界卫生组织(WHO)通过全球卫生观察站(GHO)发布、Electric Sheep Africa团队整合的该数据集,收录了1990年至2019年间47个非洲国家的年龄标准化高血压治疗覆盖率数据。其核心研究问题聚焦于非洲大陆高血压管理服务的可及性与时空演进规律,为流行病学建模、卫生政策制定及联合国可持续发展目标(SDG 3.4)的监测提供了基础性量化依据。该数据集以标准化Parquet格式呈现,纳入置信区间与性别、居住地等亚维度信息,显著提升了非洲区域健康数据在机器学习任务中的可用性,推动了数据驱动的全球健康治理研究。
当前挑战
该数据集面临的挑战主要源于非洲高血压卫生治理的复杂性。领域问题方面,非洲各国社会经济条件、医疗基础设施及数据收集能力存在巨大差异,导致治疗覆盖率估计值在国家和年份间呈现非平稳波动,传统回归模型难以准确捕捉时空异质性。构建过程中,WHO原始数据可能存在报告偏倚与缺失值,例如部分国家早期年份数据缺失或置信区间范围过大,增加了数据清洗与插补的难度。此外,亚维度(如按性别或城乡划分的数据)的稀疏分布使得分层建模易受小样本干扰,而不同来源数据的语义对齐(如国家编码一致性)也要求严格的标准化预处理,以确保下游分析的鲁棒性与可迁移性。
常用场景
经典使用场景
在非传染性疾病的流行病学研究中,高血压治疗覆盖率的时空动态分析是一项基础而关键的议题。该数据集汇聚了1990至2019年间非洲47个国家、年龄标准化后30至79岁成年人高血压治疗覆盖率的国家级观测数据,为构建面板数据模型和纵向趋势分析提供了理想素材。研究者可借此描绘非洲大陆高血压治疗覆盖的历史轨迹,比较不同国家与次区域的进展差异,亦可将其作为核心因变量,探索卫生政策、经济水平或医疗资源等影响因素的作用机制。
解决学术问题
长期以来,非洲地区高血压治疗覆盖率的系统性、可比性数据匮乏,严重制约了全球卫生治理中‘高血压控制’这一可持续发展目标(SDG 3.4)的监测与评价。该数据集通过统一的WHO标准化指标与年龄标化方法,填补了非洲大陆高质量面板数据的空白。它使得学术界能够量化非洲在高血压治疗可及性方面的进展与瓶颈,评估各国是否处于达成WHO‘全球非传染性疾病行动计划’所设定目标的正轨,并为跨区域比较与健康不平等研究提供了可靠的数据底座。
实际应用
在实际公共卫生决策与项目评估中,该数据集可作为证据驱动的规划工具。国家卫生部门与国际组织(如WHO、世界银行)可基于数据识别治疗覆盖率长期偏低或改善停滞的热点国家,优先调配资源,设计针对性干预措施。例如,结合年份与国别数据,可评估大型慢性病防控项目(如‘全球心脏倡议’)在非洲特定地区的实施效果。此外,该数据还能支撑流行病学模型的参数化,助力预测未来高血压相关疾病负担,指导卫生体系资源配置。
数据集最近研究
最新研究方向
在非洲公共卫生与慢性非传染性疾病防控领域,该数据集聚焦于30至79岁成年人群高血压治疗覆盖率的年龄标准化评估,为全球健康观测与区域健康不平等研究提供了关键数据支撑。当前前沿研究方向包括利用该时间序列数据(1990-2019年)构建机器学习模型,以预测非洲各国高血压治疗覆盖率的时空演变趋势,并结合社会经济、医疗资源及政策干预等关联变量,揭示治疗覆盖率差异的深层驱动因素。此外,该数据集与WHO全球健康观测站(GHO)的衔接,使其成为评估联合国可持续发展目标(SDG 3.4)中关于降低非传染性疾病过早死亡率进展的核心工具,尤其在数据稀缺的非洲地区,其标准化且可复用的结构为跨学科交叉验证和公共卫生决策优化开辟了新路径,推动以证据为基础的资源分配与精准干预策略的落地。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务