electricsheepafrica/africa-who-pharmacists-hwf0014
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-pharmacists-hwf0014
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家WHO GHO指标“药剂师(每10,000人)”(HWF_0014)的国家级观测数据,时间跨度为1990年至2024年。它是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括了置信区间边界(value_low,value_high)。覆盖范围包括47个非洲国家,总行数为463行。
This dataset contains country-level observations for the WHO GHO indicator "Pharmacists (per 10,000)" (HWF_0014) across African nations, spanning 1990–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. Coverage includes 47 African nations with a total of 463 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲大陆各国每万人中医师数量的指标(HWF_0014)。原始数据经过系统化整理与格式转换,以Parquet文件形式呈现,并遵循统一的模式架构。所有数值均取自API中的浮点精度字段'NumericValue',而非显示字符串,确保了数值的精确性与机器学习任务的适用性。同时,当置信区间数据可用时,数据集还包含了'value_low'和'value_high'字段,为不确定性的量化提供了支撑。
特点
数据集覆盖了1990年至2024年间47个非洲国家的时间序列数据,共计463条观测记录,且专注于WHO非洲区域(AFR)。其独特之处在于以每万人为单位标准化药师数量,使得跨国家、跨年份的比较更具意义。数据集结构清晰,包含国家代码、年份、点估计值以及可选的置信区间界限等关键列,且由于该指标无子维度分层,每个国家-年份组合仅对应一行数据,简洁明了。这种设计使其既适用于监督学习中的回归任务,也便于进行时序分析与区域性健康状况评估。
使用方法
通过HuggingFace的datasets库,用户可便捷地加载该数据集,使用'load_dataset'函数将其转化为Pandas DataFrame格式。为获取两国均值的国家层面数据,建议筛选出'dim1'列以'_BTSX'结尾或为空的行。若需分析特定国家的时间趋势,可按'country_iso3'列进行过滤并按年份排序。该数据集提供了一种高效、标准化的方式,供研究者探索非洲地区药师资源的时空分布,并可作为机器学习模型中目标变量或特征使用的可靠基础数据源。
背景与挑战
背景概述
在非洲大陆,医疗卫生人力资源的分布不均长期制约着区域健康目标的实现。世界卫生组织全球卫生观察站(WHO GHO)于2024年发布了药剂师密度指标数据集(HWF_0014),由Electric Sheep Africa团队从官方API中提取并重构为机器学习就绪格式。该数据集聚焦每万名人口中的药剂师数量,覆盖1990至2024年间47个非洲国家的463条观测记录,旨在为非洲卫生政策制定与人工智能驱动的健康预测提供标准化数据基础。作为跨时期、跨国别的结构化资源,它填补了非洲卫生人力资源量化研究中的关键空白,助力全球健康不平等分析和资源优化配置。
当前挑战
该数据集的核心挑战在于应对非洲地区药剂师密度数据长期存在的稀疏性与不完整性问题。一方面,许多国家在早期年份或动荡时期缺乏可靠统计数据,导致时间序列中存在大量缺失值,限制了纵向趋势分析与预测模型的精度。另一方面,构建过程中需处理WHO OData接口中不同编码规则与显示字符串的异构性,例如从'NumericValue'中提取浮点数值并统一置信区间边界。此外,47个国家的数据口径可能存在差异,需谨慎处理潜在的测量偏倚与跨国可比性,以保障下游多国对比模型的有效性。
常用场景
经典使用场景
在健康人力资本与公共卫生体系的交叉研究中,非洲药师密度数据集(HWF_0014)被广泛用于刻画非洲大陆药剂人力资源的时空分布格局。研究者通常将该数据集作为核心因变量,结合经济、教育、基础设施等多维指标,构建面板数据模型以探究药师密度与区域发展水平的关联机制。其典型的使用方式包括:按国家与年份进行纵向序列分析,揭示各国药师资源配置的演变轨迹;或跨国家横向对比,识别非洲内部药师分布的异质性特征。此外,由于数据包含置信区间字段,学者可据此评估估计值的可靠性,从而在统计推断中纳入测量不确定性。该数据集简洁且结构统一的特性,使其成为机器学习的理想输入,尤其适用于回归预测任务,例如基于历史趋势训练时空插值模型以填补缺失年份的国家层面观测值。
实际应用
在实际应用层面,该数据集为非洲各国政府及国际卫生组织提供了数据驱动的决策支撑工具。例如,国家卫生部门可依据历史药师密度数据评估当前卫生人力配置的短板,并结合人口增长与疾病谱变化趋势,制定科学的药学人才培养与招聘规划。世界卫生组织等机构则利用该数据集监控可持续发展目标中关于健康服务可及性的指标进展,识别出需要优先援助的低药师密度国家。在非政府组织层面,数据集被用于评估药品捐赠与药学培训项目的实施效果,指导资源向最紧缺的区域倾斜。此外,随着人工智能与数字健康的发展,该数据集已成为训练预测非洲地区药学服务需求模型的基础资源,为远程药学、药物供应链优化等新兴应用提供先验知识。
衍生相关工作
基于非洲药师密度数据集,衍生出多项具有影响力的经典学术与工程工作。在时间序列建模领域,研究者利用该数据构建了首个涵盖非洲多国的药师密度长期预测模型,探索了ARIMA与长短期记忆网络在稀疏健康指标预测上的适用性。在空间分析方面,数据集被整合进非洲健康人力资源地图集项目,结合地理信息系统揭示了药师分布的“向心性”与“边缘化”空间集聚模式。在计量经济学方向,有学者以该数据为关键解释变量,研究了药师密度对非洲抗微生物药物耐药性流行的调节效应,拓展了健康经济学中关于专业人力资本外部性的理论边界。此外,数据集还被用于基准测试不同插补算法在健康统计中的表现,推动了缺失数据方法论在公共卫生领域的应用。这些衍生工作不仅深化了对非洲药学人力现状的理解,也为其他发展中地区开展类似数据驱动研究提供了可复用的方法论范式。
以上内容由遇见数据集搜集并总结生成



