five

electricsheepafrica/africa-who-raised-blood-pressure-bp03

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-raised-blood-pressure-bp03
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家1990-2019年间关于血压升高(收缩压>=140或舒张压>=90)的国家级观测数据,是世界卫生组织全球健康观察指标(BP_03)的一部分。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串,且在可用时包含置信区间边界(value_low,value_high)。数据集覆盖47个非洲国家,共4230行数据,并按性别等维度进行分层。

This dataset contains country-level observations for the WHO GHO indicator "Raised blood pressure (SBP>=140 OR DBP>=90) (crude estimate)" (`BP_03`) across African nations, spanning 1990–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,专为非洲地区设计,聚焦于高血压患病率(收缩压≥140毫米汞柱或舒张压≥90毫米汞柱)的粗略估计。基于47个非洲国家1990年至2019年的国家层面观测数据,研究团队将原始数据统一转换为Parquet文件格式,确保架构一致。所有数值均采用浮点精度的`NumericValue`,而非显示字符串,并保留置信区间界限(`value_low`和`value_high`),从而构建出一个机器学习就绪的高质量数据集。
特点
该数据集涵盖4230条记录,覆盖47个非洲国家及30年时间跨度,分层维度包括性别(如男女及两性合并)等亚类,每个国家、年份与分层的唯一组合均生成独立行。其标准化架构包含指示码、国家ISO代码、WHO地区、年份、数值估计值及置信区间等字段,并保留原始更新时间戳。通过统一的数据结构和缺失值处理,该数据集尤适合进行跨国家、跨时间维度的健康指标分析,以及作为分类或回归任务的训练数据。
使用方法
使用者可通过HuggingFace的`datasets`库便捷加载,调用`load_dataset`函数即可获取数据。随后可利用Pandas转换格式,并根据分析需求进行筛选:例如,通过`dim1`字段过滤出两性合并(`_BTSX`)的国家级数据以排除分层干扰,或依据`country_iso3`字段提取特定国家的时间序列。该数据集可直接用于机器学习建模,如预测高血压趋势或评估干预效果,也支持按年份或维度聚合后进行回归与分类任务。
背景与挑战
背景概述
该数据集聚焦于非洲地区人群血压升高(收缩压≥140 mmHg或舒张压≥90 mmHg)的粗患病率,由世界卫生组织(WHO)全球卫生观察站(GHO)发布,并经Electric Sheep Africa团队整理为机器学习就绪格式。数据集覆盖1990年至2019年间47个非洲国家的4,230条观测记录,整合了WHO AFRO区域内的国别、年份及性别与居住地类型等亚维度信息。血压升高作为心血管疾病的核心风险因子,在非洲地区呈现持续上升的流行趋势,该数据集为跨时空分析非洲高血压负担、探索社会健康不平等性及制定精准干预策略提供了关键的基础数据支撑,对全球慢性病流行病学研究与公共卫生政策制定具有重要参考价值。
当前挑战
数据集面临的挑战主要体现在两方面。在领域问题层面,血压升高与生活方式、医疗可及性及遗传背景等多因素复杂关联,单纯依赖粗患病率指标难以精确刻画区域间的病因学差异;同时,非洲各国健康监测体系发展不均衡,数据时空分布的异质性导致跨国家比较与趋势推断易受统计偏差影响。在构建过程中,原始数据需从WHO OData API逐项提取并统一转换为Parquet格式,过程中需处理不同年份与国家的数据结构差异、缺失值(如部分置信区间缺失)以及亚维度(如性别、居住地)重编码的标准化问题,确保机器学习任务中Schema一致性与数据完整性。
常用场景
经典使用场景
该数据集围绕世界卫生组织全球卫生观察站所定义的血压升高指标(收缩压≥140或舒张压≥90),系统收录了1990年至2019年间47个非洲国家的综合观测数据。在流行病学与公共卫生领域,研究者常利用这一数据集进行非洲大陆高血压负担的纵向趋势分析,通过性别分层(如男性、女性及两性合计)和国家层面粗估值的比较,揭示不同区域、不同时期高血压流行率的变化格局。数据集以统一的Parquet格式和结构化字段(包括点估计值及置信区间)呈现,极大便利了机器学习建模与统计推断的开展。
衍生相关工作
围绕该数据集衍生了一系列有价值的学术工作与工具资源。作为Electric Sheep Africa统一数据集生态的一部分,它与非洲其他健康指标数据(如血糖、肥胖率等)共同促进了多指标联合分析与跨病种比较研究。研究人员已基于这些数据开发时间序列预测模型、空间疾病图谱以及风险因素回归分析框架。此外,数据集的标准化清洗与公开共享流程,激励了更多在非洲卫生数据上开展的可重复性研究,为构建面向可持续发展目标的健康监测体系提供了方法论借鉴与基准数据集支撑。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区1990至2019年间血压升高(收缩压≥140或舒张压≥90)的粗估患病率,为探索非洲心血管疾病负担的时间演变与地域差异提供了关键数据支撑。当前前沿研究方向包括:结合性别、城乡等亚维度分层分析,揭示高血压风险在非洲不同人群中的异质性;利用长跨度的时序数据构建机器学习预测模型,评估区域政策干预效果;以及将本数据集与其他WHO全球健康指标(如肥胖、糖尿病等)联动,开展多因素因果推断与健康系统韧性研究。在非洲高血压患病率持续攀升的公共卫生热点背景下,该数据集推动了从描述性统计向可操作、可预警的智能健康监测范式的转变,对实现WHO全球非传染性疾病控制目标具有重要的基准意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务