five

electricsheepafrica/africa-who-number-of-deaths-attributed-to-non-communicable-diseases

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-deaths-attributed-to-non-communicable-diseases
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2019年间,由世界卫生组织全球健康观察站(WHO GHO)提供的非传染性疾病死亡人数的数据。数据按疾病类型和性别分类,并包含国家、年份、数值估计、置信区间等信息。数据集由Electric Sheep Africa重新打包,并以Parquet格式提供,便于机器学习使用。

This dataset contains country-level observations for the WHO GHO indicator Number of deaths attributed to non-communicable diseases, by type of disease and sex (SDG_SH_DTH_RNCOM) across African nations, spanning 2000–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,针对非洲地区47个国家,系统收集了2000年至2019年间非传染性疾病导致的死亡人数数据。数据按疾病类型和性别进行分层,每个国家、年份及维度的独特组合构成独立观测行。原始数据以Parquet格式存储,保留一致性架构,其数值字段(NumericValue)被精确提取,并包含可用的置信区间边界值(value_low、value_high)。所有观测均基于WHO AFRO区域代码(ParentLocationCode = 'AFR')进行过滤,确保地域聚焦。
使用方法
该数据集可通过HuggingFace Datasets库便捷加载,使用load_dataset函数直接获取训练集,并转换为Pandas DataFrame进行后续处理。建议针对特定分析目标进行筛选:例如通过dim1字段过滤‘SEX_BTSX’或空值以获取全国两性汇总数据;或利用country_iso3和year字段提取特定国家的时间序列。对于回归与分类任务,value_numeric字段可直接作为预测目标。此外,借助dim2等维度可实现更细粒度分析,并利用value_low和value_high评估模型不确定性。
背景与挑战
背景概述
非传染性疾病(NCDs)已成为全球公共卫生领域面临的重大挑战,尤其在非洲地区,其疾病负担正快速攀升。世界卫生组织(WHO)全球卫生观察站(GHO)发布的“非洲归因于非传染性疾病死亡人数”数据集,由Electric Sheep Africa团队重新整理并公开,收录了2000至2019年间47个非洲国家的死亡统计信息,按疾病类型与性别进行分层。该数据集旨在支持联合国可持续发展目标(SDG 3.4)中关于减少NCDs过早死亡率的监测与评估,为流行病学建模、政策制定及机器学习研究提供了高质量的结构化数据来源,在区域健康研究和数据科学领域具有重要的基础性价值。
当前挑战
该数据集所应对的核心领域挑战在于,非洲地区非传染性疾病导致的死亡数据长期存在碎片化、缺失或不一致的问题,难以支撑精准的跨国家趋势分析与干预效果评估。数据集构建过程中则面临多重困难,包括从WHO OData API提取多元维度(如性别、地区类型)的复杂分层数据,需要对缺失置信区间值和显示字符串进行清洗与统一,还需确保47个国家在二十年间的时间序列完整性,并克服因各国报告标准和更新频率差异引发的数据对齐难题。
常用场景
经典使用场景
在非传染性疾病(NCDs)的流行病学监测中,该数据集提供了非洲47个国家在2000至2019年间因非传染性疾病死亡人数的精细化统计,涵盖疾病类型与性别维度。研究者和公共卫生机构可利用其结构化的指标代码(SDG_SH_DTH_RNCOM)与年份、国家分层,开展纵向趋势分析或横截面比较。尤为重要的是,该数据支持按性别(SEX_BTSX、SEX_FMLE、SEX_MLE)拆分,从而揭示性别在NCDs死亡负担中的差异,为靶向干预政策的制定提供量化证据。结合置信区间字段(value_low、value_high),用户还能评估估计值的稳健性,适用于风险模型验证与不确定性量化等经典场景。
解决学术问题
该数据集直接回应了全球健康研究中关于非洲地区非传染性疾病负担的长期数据短缺问题。学术研究通常受限于零散、不兼容的跨国家死亡统计,而此数据集通过统一WHO GHO标准,整合了47个非洲国家的连续时间序列观测,填补了区域健康统计的空白。研究人员得以量化心血管疾病、癌症、糖尿病及慢性呼吸系统疾病等NCDs的死亡率时空分布,进而探究社会经济因素、医疗资源可及性与死亡负担之间的关联。此外,该数据支持对可持续发展目标(SDG)指标3.4(减少NCDs过早死亡率)的进展评估,推动跨学科对话,强化全球健康不平等议题的实证基础。
实际应用
在实际应用层面,该数据集是非洲各国卫生部、世界卫生组织区域办事处及非政府组织制定循证健康策略的核心工具。公共卫生决策者可借鉴其中的年度死亡数统计,识别高负担区域和脆弱群体(如特定性别人群),进而优化非传染性疾病预防与控制项目的资源配置。例如,通过分析性别分层数据,政策制定者可以发现女性或男性在特定NCDs中是否面临更高风险,从而设计有针对性的筛查或健康教育活动。同时,该数据集也为国际援助机构评估干预效果提供了基线参考,支持动态监测死亡率的年度波动,助力实现2030年可持续发展目标中的健康相关承诺。
数据集最近研究
最新研究方向
该数据集围绕非洲地区非传染性疾病(NCDs)导致的死亡负担展开,覆盖47个国家2000至2019年的时空序列数据,并细分疾病类型与性别维度。在全球公共卫生领域,这一资源正被用于构建机器学习和统计模型,以追踪非洲大陆非传染性疾病死亡率的变化趋势,并评估与可持续发展目标(SDG 3.4)相关的进展。结合世界卫生组织全球健康观察站(GHO)的权威数据,研究者可借此分析不同性别和地区间的健康不平等现象,识别高风险人群,并为政策干预提供数据支撑。随着气候变化、城市化与人口老龄化加剧,该数据集在预测疾病模式、优化医疗资源配置及评估干预措施效果方面展现出前沿价值,尤其在非洲卫生系统数字化转型的背景下,其作为开源、机器可读的基准数据,推动了应用流行病学与数据科学的交叉研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务