electricsheepafrica/africa-who-nursing-and-midwifery-personnel-hwf0006
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-nursing-and-midwifery-personnel-hwf0006
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标护理和助产人员(每10,000人)(HWF_0006)在非洲国家的国家级观测数据,时间跨度为1990年至2024年。数据集是Electric Sheep Africa项目的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集涵盖47个非洲国家,共565行数据。
This dataset contains country-level observations for the WHO GHO indicator Nursing and midwifery personnel (per 10,000) (HWF_0006) across African nations, spanning 1990–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 565 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,聚焦于非洲地区每万人拥有的护理与助产人员数量这一关键卫生人力资源指标(代码HWF_0006)。原始数据经由OData API获取后,被重新整理为符合机器学习应用标准的Parquet格式文件,并纳入Electric Sheep Africa统一数据仓库。构建过程中,所有数值均直接采用原始API返回的浮点精度字段“NumericValue”,而非格式化显示字符串,同时保留了可获取的置信区间上下界信息,从而确保了数据的准确性与统计完整性。
特点
该数据集覆盖了47个非洲国家自1990年至2024年的年度观测记录,共计565行数据,空间范围严格限定于WHO非洲区域(AFR)。其核心特点在于提供了统一的列式结构,包含指标代码、国家ISO3代码、年份、数值估计及置信区间等字段,并附加了维度类型与维度值(如性别或居住地区类型)以支持细粒度分析。由于该指标无子维度划分,每个国家与年份组合仅对应单一数值,使得数据结构简洁明了,便于直接用于回归或分类任务。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据集,例如使用`load_dataset("electricsheepafrica/africa-who-nursing-and-midwifery-personnel-hwf0006")`命令获取训练集,并转为Pandas DataFrame进行分析。为聚焦于全国总体状况,建议过滤出维度值为`SEX_BTSX`或缺失的条目。针对特定国家的时间序列分析,则可依据`country_iso3`字段筛选并结合年份排序,从而有效洞察护理人力资源的长期演变趋势。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)通过全球卫生观察站(GHO)于2024年发布,并经Electric Sheep Africa团队重新打包整理,聚焦于非洲地区的护理与助产人员密度(每万人)。其核心研究问题在于量化非洲各国1990至2024年间卫生人力资源的分布状况,为评估区域医疗体系承载力、实现全民健康覆盖目标提供关键数据支撑。该数据集覆盖47个非洲国家,共565条观测记录,凭借标准化且机器学习友好的格式,在卫生政策分析、流行病学研究及可持续发展目标监测领域具有重要参考价值,尤其在资源匮乏地区的人力规划中展现出显著影响力。
当前挑战
卫生人力数据领域面临的核心挑战在于获取精确且跨时空可比的指标,以克服非洲地区普遍存在的统计系统薄弱与数据收集不连续问题。该数据集构建过程中需应对多重困难:首先,原始数据源自WHO的OData API,格式异构且包含大量显示字符串与置信区间标记,需精细清洗以提取精确浮点数值;其次,不同国家在年份覆盖率上存在显著差异,部分国家数据缺失严重,需在保持时序完整性的同时避免引入偏差;此外,少数指标包含按性别或居住地划分的分层维度,增加了数据整合时的一致性与可比性要求。
常用场景
经典使用场景
该数据集涵盖1990至2024年间47个非洲国家的护理与助产人员密度指标(每万人拥有量),是研究非洲区域卫生人力资源时空分布的核心数据源。经典使用场景包括构建面板数据模型,分析护理人员密度随时间演变的趋势和区域差异;或作为回归任务中的目标变量,探索经济水平、疾病负担、卫生支出等特征对其影响。数据以结构化的Parquet格式提供,便于与气候、冲突等多源数据融合,服务于跨学科的卫生政策分析。
解决学术问题
数据集直面非洲卫生人力资源数据稀缺且不统一的学术困境,通过标准化整理WHO全球卫生观察站的高频更新数据,有效支持了卫生系统韧性评估和可持续发展目标(SDG 3.c)进程的量化研究。它帮助学术界克服了在脆弱国家背景下理解护理助产人员分布不均的障碍,为探讨卫生人力短缺与母婴健康结局、传染病防控成效之间的关联提供了可靠依据,推动了基于证据的卫生人力规划研究。
衍生相关工作
该数据集作为“非洲电子羊”系列开源项目的一部分,催生了多项聚焦非洲大陆的卫生数据科学工作。其衍生的经典工作包括:利用该数据训练回归模型,预测未观测年份的卫生人力密度;将其与GDP、冲突事件等数据集合并,开展因果推断研究;以及教授学生如何对WHO官方API数据进行清洗、标准化和机器学习就绪处理。该数据集还常被用作教程案例,展示如何在HuggingFace平台上构建跨国的、可复现的卫生统计数据集。
以上内容由遇见数据集搜集并总结生成



