electricsheepafrica/africa-who-uhc-service-coverage-index
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-uhc-service-coverage-index
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标UHC Service Coverage Index (SDG 3.8.1)(`UHC_INDEX_REPORTED`)在非洲国家的国家级观测数据,时间跨度为2000年至2023年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。数据集涵盖47个非洲国家,总行数为1,128行,并包含多个字段,如国家代码、年份、数值估计值、置信区间等。
This dataset contains country-level observations for the WHO GHO indicator UHC Service Coverage Index (SDG 3.8.1) (`UHC_INDEX_REPORTED`) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 47 African nations with a total of 1,128 rows and includes fields such as country code, year, numeric estimate, confidence intervals, etc.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,汇集了非洲47个国家从2000年至2023年间与可持续发展目标3.8.1相关的全民健康覆盖(UHC)服务覆盖指数观测值。原始数据经过清洗与重构,以Parquet格式存储,并采用统一的列式架构。所有数值均取自浮点精度的NumericValue字段,而非显示字符串,同时保留了置信区间上下限(value_low、value_high),确保数据的精确性与完整性。数据集由Electric Sheep Africa团队整理,专为机器学习应用优化。
特点
本数据集具有鲜明的结构化特征:涵盖47个非洲国家、1128条时间序列观测,时间跨度长达24年。每条记录包含国家代码、年份、核心指数值及其置信区间,以及可能的分层维度(如性别或居住地区类型),为细粒度分析提供支持。数据采用ISO 3166-1 alpha-3国家编码与WHO区域编码,便于跨数据集融合。所有观测均针对UHC_INDEX_REPORTED单一指标,无子维度拆分,保证了数据的一致性与简洁性,适合直接用于回归或分类任务。
使用方法
数据集可通过HuggingFace的datasets库轻松加载:调用load_dataset('electricsheepafrica/africa-who-uhc-service-coverage-index')即可获取训练集,并转换为Pandas DataFrame以供分析。用户可借助dim1字段过滤分层数据,例如筛选以_BTSX结尾的值以获取两性综合的国家级观测,或按国家代码(如country_iso3 == 'KEN')提取特定国家的时间序列。数据亦适宜作为机器学习模型的输入特征或目标变量,支持时序预测、区域比较等任务。
背景与挑战
背景概述
全民健康覆盖(UHC)服务覆盖指数作为联合国可持续发展目标3.8.1的核心衡量指标,是评估全球卫生系统绩效的关键工具。该数据集由世界卫生组织通过全球卫生观察站(GHO)系统采集,经Electric Sheep Africa团队于2023年进行系统化整合与封装,聚焦非洲大陆47个国家在2000至2023年间的UHC指数变化。研究团队通过标准化数据架构将原始OData API接口数据转化为机器学习就绪格式,涵盖1128条国家-年度观测记录,并保留了置信区间等关键统计特征。该数据集的发布填补了非洲区域UHC长期追踪数据的结构化空白,为卫生政策制定者、全球健康研究者和数据科学家提供了统一的分析基础,尤其支持基于时间序列的非洲卫生系统效能评估、区域不平等性分析及干预措施效果建模等研究场景。
当前挑战
该数据集面临的核心挑战体现在两个层面:在领域问题层面,UHC指数作为复合指标,其计算涉及生殖健康、传染病控制、非传染性疾病管理及医疗服务可及性等多维度权重分配,不同非洲国家因数据采集能力差异导致指数可比性存在隐含偏差,且部分国家早期年份数据缺失限制了长周期趋势分析的完整性。在数据构建层面,WHO GHO原始数据存在多版本更新滞后问题,不同年份间的统计口径调整可能引入系统性误差;同时,指标维度仅提供单一汇总值而未呈现子维度的分解信息,使得针对性别、城乡等亚组的精细化分析受到制约,需依赖额外数据源进行交叉验证以降低推理不确定性。
常用场景
经典使用场景
该数据集汇聚了2000至2023年间47个非洲国家在全民健康覆盖(UHC)服务覆盖指数上的观测数据,是追踪可持续发展目标3.8.1进展的核心资源。在经典使用场景中,研究者常利用该数据构建时间序列模型,分析各国UHC指数的长期演变趋势,或通过回归分析方法识别影响健康覆盖水平的关键社会经济与政策因素。此外,该数据集也广泛用于跨国家比较研究,以揭示非洲区域内不同国家间卫生系统绩效的差异及其背后的结构性原因。
衍生相关工作
该数据集衍生出多项经典工作,包括构建非洲健康覆盖指数预测模型、开发卫生系统韧性评估框架等。相关研究利用该数据训练了基于梯度提升与深度学习的时序预测器,成功捕捉了覆盖指数的非线性演化规律。另一部分工作将其与宏观经济学、气候及冲突数据关联,揭示了政治动荡与卫生覆盖倒退之间的统计关联。还有研究者以此为核心训练数据,发布了非洲首个区域级健康覆盖可视化分析平台,均为后续政策模拟与预警系统奠定了基础。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家全民健康覆盖服务覆盖指数(SDG 3.8.1)的纵向追踪与跨区域比较研究,为评估非洲大陆健康系统绩效和可持续发展目标进展提供了关键量化工具。当前前沿研究方向包括利用2000至2023年间47个非洲国家的面板数据,通过机器学习与统计建模方法,解析健康覆盖指数与流行病学转型、健康财政投入、政治治理等复杂因素的动态关联;同时结合置信区间约束,生成稳健的预测与反事实推断,揭示新冠疫情等全球健康危机对非洲健康覆盖的冲击异质性。该数据集结构统一且集成置信区间分支,显著提升了模型训练的可解释性与鲁棒性,驱动了一系列围绕健康公平性与资源分配优化的交叉学科探索,有力支撑了后疫情时代非洲健康系统韧性建设的循证决策。
以上内容由遇见数据集搜集并总结生成



