five

electricsheepafrica/africa-who-uhc-service-coverage-sub-index-on-service-capacity-and

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-uhc-service-coverage-sub-index-on-service-capacity-and
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2023年间WHO GHO指标“UHC服务覆盖子指数(服务能力和访问)”的国家级观测数据。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。该数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator "UHC Service Coverage sub-index on service capacity and access" (`UHC_SCI_CAPACITY`) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,由Electric Sheep Africa团队重新封装并发布,旨在为非洲健康数据提供统一、机器学习就绪的格式。数据涵盖2000年至2023年间47个非洲国家的“全民健康覆盖服务能力与获取子指数”(UHC_SCI_CAPACITY)指标,共计1128条记录。所有值均从高精度浮点字段NumericValue中提取,而非显示字符串,并附有置信区间上下限(若可用)。数据以Parquet文件格式存储,采用一致的模式结构,并经过WHO AFRO区域筛选。
特点
该数据集的核心特点在于其专注于非洲区域的单一健康指标,无子维度划分,每一行对应一个国家在特定年份的观测值,结构简洁清晰。模式中包含指示符代码、国家ISO代码、WHO区域、年份、数值点估计、置信区间、显示字符串以及可能的维度类型与值(如性别或居住区域类型)。此外,数据以CC BY 4.0许可发布,确保了开源性和再利用的便利性,适用于分类与回归任务。
使用方法
使用该数据集时,可通过Hugging Face的datasets库轻松加载,代码示例为`load_dataset("electricsheepafrica/africa-who-uhc-service-coverage-sub-index-on-service-capacity-and")`,返回的数据集可直接转换为Pandas DataFrame以便分析。为了获取国家级且不分性别的数据,可过滤dim1列以选取后缀为_BTSX或空值的行。若要研究特定国家的时间序列,例如肯尼亚,可按ISO代码筛选后按年份排序。数据加载后,用户可根据自身需求进行统计分析或机器学习建模。
背景与挑战
背景概述
全民健康覆盖(UHC)是联合国可持续发展目标3(SDG 3)的核心议题,旨在确保所有人都能获得所需的高质量卫生服务而不承受经济困难。在此背景下,世界卫生组织(WHO)于2015年启动了全球卫生观察站(GHO)数据计划,并开发了UHC服务覆盖指数,其中服务能力和可及性子指数(UHC_SCI_CAPACITY)专门衡量卫生系统的基础设施、人力资源和基本服务可及性。该数据集由Electric Sheep Africa团队于2024年从WHO GHO官方OData API重新打包整理,覆盖2000至2023年间47个非洲国家的1128条观测记录,以统一的Parquet格式和标准化的模式呈现,旨在为非洲卫生系统的机器学习建模提供高质量、易用的结构化数据,推动数据驱动的政策分析与健康不平等研究。
当前挑战
该数据集所解决的领域问题聚焦于非洲卫生服务覆盖能力的量化评估与预测,传统上由于各国产出数据稀疏、定义不一和更新滞后,难以进行跨国的可比性分析与趋势建模。在构建过程中,主要挑战包括:从WHO GHO API中筛选并清洗覆盖非洲地区的数据,处理缺失值和置信区间字段的不一致性;将原始字符串形式的显示值转换为精确的浮点数(NumericValue),同时保留置信下限与上限信息;规范国家代码、区域编码和维度的统一表示,排除年际跨越中因维度定义变化导致的歧义记录;以及确保数据模式与Electric Sheep Africa其他非洲数据集兼容,便于多源融合分析。这些挑战确保了最终数据集在机器学习任务中的可靠性与可重复性。
常用场景
经典使用场景
该数据集汇集了2000至2023年间47个非洲国家的全民健康覆盖服务能力与可及性子指数观察值,为机器学习驱动的区域卫生系统评估提供了标准化、高质量的数据基础。经典使用场景涵盖基于时间序列的国家级健康覆盖能力趋势预测、跨区域服务容量聚类分析,以及利用回归模型探索社会经济变量与卫生服务可及性之间的关联。研究者通过整合置信区间信息,可开展不确定性量化分析,从而更稳健地评估各国在实现全民健康覆盖目标方面的进展与差距。
衍生相关工作
围绕该数据集已衍生出一系列高质量的学术工作与工具资源。其作为“Electric Sheep Africa”统一数据集仓库的核心组件,为非洲健康数据机器学习基准的建立奠定了基础,催生了诸如基于梯度提升树的卫生服务容量预测模型、结合地理空间数据的服务覆盖不平等性分析框架,以及利用时序聚类算法识别政策干预最佳窗口期的研究。此外,该数据还驱动了开源可复现分析管道的开发,促进了区域内数据共享与协作研究的规范化进程。
数据集最近研究
最新研究方向
在全民健康覆盖(UHC)的全球议程中,服务能力与可及性作为核心子指标,正成为评估非洲卫生系统韧性与公平性的关键前沿。该数据集聚焦于2000至2023年间47个非洲国家的UHC服务覆盖子指数,其结构化、机器学习友好的格式为利用时序分析与预测模型探索卫生系统绩效的动态演变提供了坚实数据基础。结合WHO全球卫生观测站的最新数据,研究者可深入剖析COVID-19大流行对非洲卫生服务能力的冲击及恢复轨迹,并借助置信区间信息量化不确定性,从而为资源匮乏地区的卫生政策优化与干预措施设计提供循证支撑,推动非洲大陆迈向更可持续的全民健康覆盖目标。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作