electricsheepafrica/africa-who-diabetes-treatment-coverage-tmentcrude
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-diabetes-treatment-coverage-tmentcrude
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“糖尿病治疗覆盖率,粗率”(NCD_DIABETES_TREATMENT_CRUDE)在非洲国家的国家级观察数据,时间跨度为1990年至2022年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO全球健康观察站OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Diabetes treatment coverage, crude" (NCD_DIABETES_TREATMENT_CRUDE) across African nations, spanning 1990–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区糖尿病治疗覆盖率的粗估计指标(NCD_DIABETES_TREATMENT_CRUDE)。Electric Sheep Africa团队对原始数据进行系统性整理与重新打包,将其转化为格式统一的Parquet文件,并确保所有数值均采用浮点精度的`NumericValue`字段,而非显示字符串。数据涵盖1990年至2022年间47个非洲国家的观测记录,共计4653行,同时保留了置信区间上下限(`value_low`和`value_high`)等关键统计信息。
特点
该数据集最显著的特点在于其结构化与多维度的设计。每条记录包含国家、年份、指标代码等核心字段,并通过`dim1_type`和`dim1`等维度列实现性别(如两性、女性、男性)或居住地类型等分层信息的存储,便于用户按具体亚组进行筛选或聚合分析。此外,数据集的输入特征(如地区、年份)与回归或分类任务的输出目标(`value_numeric`)清晰分离,使其可直接应用于机器学习建模,兼具统计严谨性与计算便利性。
使用方法
用户可通过Hugging Face的`datasets`库轻松加载该数据集,例如运行`load_dataset('electricsheepafrica/africa-who-diabetes-treatment-coverage-tmentcrude')`并将其转换为Pandas DataFrame进行后续分析。为提取特定子集,可依据`dim1`字段筛选出两性全国层面的数据(如筛选以`_BTSX`结尾的行),或通过`country_iso3`列定位单个国家的时间序列。数据集还支持用户对分层维度进行聚合,以匹配不同的研究需求,如跨性别或区域计算总体均值。
背景与挑战
背景概述
该数据集由非洲数据统一平台Electric Sheep Africa在2022年基于世界卫生组织全球卫生观察站(WHO GHO)的公开数据整理而成,聚焦于非洲47个国家在1990年至2022年间糖尿病治疗覆盖率的粗率指标(NCD_DIABETES_TREATMENT_CRUDE)。作为非传染性疾病防控领域的重要监测指标,糖尿病治疗覆盖率直接反映卫生系统对慢性病管理的能力与公平性。该数据集通过提供标准化的机器学习就绪格式,填补了非洲区域长期缺乏高质量、跨时间维度糖尿病干预数据的空白,为流行病学建模、卫生政策评估及国际健康目标(如SDG 3.4)的追踪提供了关键支撑。其结构化字段(包括性别与地域分层的置信区间)进一步增强了数据在回归与分类任务中的适用性,在非洲健康数据生态中具有基础性价值。
当前挑战
该数据集所应对的核心领域挑战在于非洲糖尿病治疗覆盖率长期存在数据稀疏性、测量标准不统一及监管报告碎片化,导致难以精确评估各国卫生系统在非传染性疾病管理上的真实进展。具体挑战包括:其一,数据跨年度与国家的可比性受限于WHO报告中定义与采集方法的动态调整,尤其1990至2022年间部分国家存在间断记录;其二,构建过程中需从WHO OData API中解析并统一转换为无歧义的数值型字段(NumericValue),避免因显示字符串格式引入解析错误;其三,性别与居住区类型等亚维度(dim1/dim2)的缺失导致样本分层间存在非随机空值,需在模型训练前谨慎设计插补或聚合策略,以防引入偏差。
常用场景
经典使用场景
在公共卫生与流行病学研究的璀璨星空中,非洲地区糖尿病治疗覆盖率的粗率数据犹如一盏指路明灯。该数据集汇聚了世界卫生组织全球卫生观察站自1990年至2022年间、覆盖47个非洲国家的跨年度观测记录,为学者们提供了一个系统评估非洲大陆糖尿病治疗可及性与覆盖动态的珍贵窗口。经典应用场景集中于构建时间序列模型以刻画各国治疗覆盖率的演变轨迹,或运用面板数据分析方法揭示不同性别及亚人群之间的治疗差异,从而在宏观层面描绘出非洲糖尿病防控的波澜壮阔图景。
衍生相关工作
围绕这一数据集,学术界已衍生出诸多富有启发的相关研究工作。经典工作包括利用该数据构建机器学习预测模型,以早期指标推断非洲各国的糖尿病治疗覆盖率趋势;亦有学者将其与其他慢性病指标数据集融合,形成非洲非传染性疾病的多维监测矩阵,开展联合建模与风险因素挖掘。更为深入的衍生工作则聚焦于治疗覆盖率不平等性的空间计量分析,结合地理信息系统绘制非洲糖尿病治疗服务的公平性地图,或运用贝叶斯层次模型处理缺失数据以推估历史治疗水平。这些衍化成果不仅拓展了数据本身的科学边界,也催化了非洲健康数据生态系统的崛起。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区糖尿病治疗覆盖率的时空演变格局,为全球非传染性疾病防控研究提供了关键数据支撑。当前前沿方向集中于利用该数据构建机器学习预测模型,探究社会经济、医疗资源与糖尿病治疗可及性之间的深层关联,尤其关注性别间治疗差异与城乡分布不均等热点问题。结合WHO非洲区域(AFRO)的卫生政策目标,研究者正通过该数据集量化1990至2022年间非洲国家在糖尿病管理上的进展与瓶颈,为优化资源分配、缩小健康不平等提供实证依据,其意义在于推动数据驱动的非洲公共卫生决策从描述性统计向预测性干预转型。
以上内容由遇见数据集搜集并总结生成



