electricsheepafrica/africa-who-pharmaceutical-technicians-and-assistants
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-pharmaceutical-technicians-and-assistants
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家WHO GHO指标药剂师技术人员和助理(数量)(HWF_0016)的国家级观察数据,时间跨度为1985年至2024年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Pharmaceutical Technicians and Assistants (number)" (HWF_0016) across African nations, spanning 1985–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源于世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口(OData API),专注于非洲区域。原始数据经过系统性采集与重构,以Parquet文件格式统一存储,确保结构一致性与机器学习友好性。所有数值均取自浮点精度字段NumericValue,而非展示字符串,并尽可能纳入了置信区间上下限。数据覆盖1985年至2024年间47个非洲国家的年度观测值,共计294条记录,严格限定于WHO非洲区域(ParentLocationCode = 'AFR'),构建过程强调数据的纯净度与可复现性。
特点
该数据集的核心特色在于其专业性与高针对性,聚焦于非洲国家医药技术人员与助理的人力资源数量指标(HWF_0016)。数据结构精简,每个国家每年仅对应单一数值,无额外分层维度,简化了分析复杂度。同时,数据列包含丰富的元信息,如指标代码、国家ISO代码、世卫区域、年份及置信区间,支持精确的时间序列分析和国家间比较。作为Electric Sheep Africa系列的一部分,其统一的模式设计便于与其他非洲健康指标数据集成,为区域卫生政策研究提供可靠基础。
使用方法
用户可通过Hugging Face的datasets库便捷加载数据,使用`load_dataset('electricsheepafrica/africa-who-pharmaceutical-technicians-and-assistants')`命令即可获取训练集,并灵活转换为Pandas DataFrame进行后续分析。典型应用包括筛选全国层面、两性合计的数据,或针对特定国家(如肯尼亚)按年份排序生成时间序列。数据集适用于表格分类与回归任务,可直接将`value_numeric`列作为目标变量,配合国家和年份特征构建预测模型或进行趋势分析,操作简便且门槛较低。
背景与挑战
背景概述
在非洲大陆,医疗卫生人力资源的配置与分布一直是制约全民健康覆盖(UHC)实现的关键瓶颈。世界卫生组织(WHO)全球卫生观察站(GHO)长期追踪各类卫生工作者数据,以支持政策制定与资源配置。该数据集由Electric Sheep Africa团队于2024年重构并发布,聚焦于WHO GHO指标HWF_0016,即非洲国家药学技术人员和助理的数量统计。它整合了1985至2024年间47个非洲国家的官方数据,旨在为机器学习模型提供标准化、机器可读的表格数据,推动非洲健康领域的计算社会科学研究。凭借其统一的数据模式与高质量来源,该数据集已成为分析非洲药学人力规模、分布动态及健康系统脆弱性的重要基础资源,为跨境比较与时间序列建模奠定了数据基石。
当前挑战
该数据集所面对的领域挑战在于,非洲各国药学技术人员的数据稀疏性和不均衡性严重阻碍了可靠的跨国家与跨时间分析。由于许多国家存在长期缺失观测值、数据报告频率不一致等问题,模型难以在低样本量下捕捉真实的人力资源演变趋势。此外,构建过程中需将WHO OData API中结构松散的原始数据转化为统一Parquet格式,并处理字符串型数值与缺失置信区间等异构表达。同时,部分记录中存在分层维度(如性别或城乡),增加了聚合与归一化的复杂性。上述挑战不仅考验数据清洗的精度,也要求在机器学习建模时采用稳健的缺失值处理与领域知识引导的特征工程策略,以避免偏差放大。
常用场景
经典使用场景
在卫生人力的量化研究中,该数据集最经典的使用场景是对非洲各国药剂技术人员和助理的存量进行纵向比较与时空建模。研究者可依据国家ISO代码和年份字段,提取1985至2024年间跨越47个非洲国家的年度观测值,结合置信区间开展趋势分析与区域性差异评估。这一数据结构兼容时间序列预测、跨国家回归以及面板数据分析等经典统计方法,为理解非洲药剂人力配置的动态演变提供标准化、机器就绪的数据基础。
解决学术问题
该数据集有效解决了非洲卫生人力研究中长期存在的跨国可比数据缺失问题。通过系统整合世界卫生组织全球卫生观察站中药剂技术人员与助理的官方统计,统一了字段模式与数值精度,使研究者能够聚焦于药剂人力密度与疾病负担之间的关系、卫生系统韧性评估以及可持续发展目标卫生人力指标的追踪。其直接推动了面向资源匮乏地区的卫生政策评估与干预效果建模,为全球健康治理提供了实证支撑。
衍生相关工作
围绕该数据衍生的经典工作涵盖多个方向:其一,构建面向非洲卫生人力的多指标面板库,融合药剂人力与医师、护士等职业的时序列数据,开展综合人力密度建模;其二,开发时间序列异常检测算法,识别人力报告中潜在的统计偏差或缺失值插补策略;其三,结合地理空间数据绘制非洲药剂人力热力图,揭示国家内部分布不均现象。这些研究推动了从单一指标分析到跨源数据融合、从静态描述到动态预测的方法论进化。
以上内容由遇见数据集搜集并总结生成



