electricsheepafrica/africa-who-nursing-personnel-hwf0026
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-nursing-personnel-hwf0026
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含WHO GHO指标护理人员比例(HWF_0026)在非洲国家的国家级观察数据,时间跨度为1999年至2024年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Nursing personnel (%) (HWF_0026) across African nations, spanning 1999–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区“护理人员占比”(HWF_0026)这一关键指标。数据经过系统化的提取与整合,以Parquet文件格式重新封装,并遵循统一的Schema规范。所有观测值均采用浮点精度的`NumericValue`字段,而非显示字符串,同时尽可能保留了置信区间界限(`value_low`、`value_high`),确保了原始数据的精确性与统计完整性。数据覆盖1999至2024年间39个非洲国家的396条记录,按WHO AFRO区域过滤,并包含性别等子维度 stratification,从而为多维度的分析提供了坚实基础。
特点
该数据集的核心特点在于其高度的结构化与机器学习的易用性。它提供了包括指标代码、国家ISO代码、年份、数值型观测值及置信区间在内的标准字段,并创新性地引入了`dim1`与`dim2`列,清晰地标识了性别、居住区域类型等分层维度,使研究者能够便捷地按子群体筛选数据。数据集规模虽小(不足1千条),但覆盖了长达25年的跨国家时间序列,且所有数值均以原生浮点数存储,跳过了格式化的显示字符串,直接作为回归或分类任务的特征,极大简化了预处理流程。加之其CC BY 4.0的开放许可,为非洲卫生人力资源领域的定量分析提供了标准化、可复现的数据基石。
使用方法
使用该数据集极为简洁,推荐通过HuggingFace的`datasets`库进行加载:`ds = load_dataset('electricsheepafrica/africa-who-nursing-personnel-hwf0026')`,随后可转换为pandas DataFrame进行分析。在具体应用中,用户可通过过滤`dim1`列中结尾为`_BTSX`的条目或处理缺失值,轻松获取两性合计的国家级数据;同时,按`country_iso3`与`year`字段进行排序与切片,即可提取特定国家的纵向时间序列。对于有监督学习任务,`value_numeric`列可直接作为模型的目标变量,而`value_low`与`value_high`则提供了估计的不确定性度量,便于构建更稳健的预测模型。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2024年整理发布,源自世界卫生组织全球卫生观察站(WHO GHO),聚焦非洲地区护理人员占卫生人力比例(HWF_0026)这一关键指标。核心研究问题在于量化非洲各国护理人力配置的时空演变,以揭示卫生系统人力资源的分布特征与动态变化。作为统一、机器学习就绪的非洲数据仓库组成部分,该数据集为区域卫生政策制定、国际比较研究及可持续健康目标(如SDG 3)的监测提供了标准化数据基础,推动了数据驱动的非洲公共卫生研究。
当前挑战
数据集所解决的领域挑战是非洲卫生人力结构性失衡问题:护理人员占比是衡量卫生系统服务能力与韧性的核心指标,但非洲多国长期面临护理人才短缺、分布不均及数据碎片化困境。构建过程中,挑战在于从WHO OData API整合39国1999–2024年跨度的异构数据,需处理因性别、居住地类型等亚维度带来的分层复杂性,并确保缺失置信区间、部分年份无记录等不完整数据能够转换为统一、可分析的数值型格式,同时保留置信区间边界以支撑后续的统计推断与建模任务。
常用场景
经典使用场景
在非洲公共卫生研究领域,护理人员占比是衡量卫生系统人力资源配置与初级卫生保健可及性的核心指标。该数据集基于世界卫生组织全球卫生观察站提供的HWF_0026指标,汇集了1999年至2024年间39个非洲国家的护理人员比例信息,涵盖性别分层维度与置信区间数据。研究者可借助这一高质量、结构化的表格数据,进行长期趋势分析、区域间横向比较,或作为机器学习模型中的回归或分类任务的特征输入。其经典使用方式包括:将逐年观测值构建为面板数据以评估国家卫生人力政策的演进效果,或利用数值变量预测卫生服务覆盖水平与健康结果之间的关联,从而揭示护理人力资源与社区健康韧性之间的深层联系。
衍生相关工作
基于该数据集衍生的经典工作包括:一是构建非洲卫生人力亚型分类模型,结合HWF_0026与其他护理密度指标,利用聚类算法识别护理资源匮乏的典型国家群组;二是开发因果推断框架,探究护理人员占比变化与抗生素耐药性传播、传染病控制效果之间的非线性关系;三是将时序数据引入深度概率预测模型,生成多国护理人力供给的贝叶斯置信区间,辅助长期卫生规划。这些工作不仅深化了对非洲卫生系统动态复杂性的理解,还推动了可复用的数据基线库建设,催生了如Electric Sheep Africa系列数据集的标准化流程,为跨学科协作与开放科学实践树立了典范。
数据集最近研究
最新研究方向
在非洲卫生人力构成的前沿研究中,护理人员占比(HWF_0026)数据集已成为评估区域卫生系统韧性的关键指标。当前研究热点聚焦于利用1999至2024年间39个非洲国家的时序数据,结合性别分层维度(SEX_FMLE/SEX_MLE)与置信区间,分析新冠疫情后护理人力资源的恢复轨迹与转型路径。该数据集与WHO全球卫生观测站联动,为非洲卫生人力短缺与可持续发展目标(SDG 3)的衔接提供了量化基石,尤其在全球卫生安全议程中,其揭示的城乡护理分布失衡问题正推动政策向社区护理与远程健康服务倾斜。
以上内容由遇见数据集搜集并总结生成



