five

electricsheepafrica/africa-who-human-resources

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-human-resources
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2021-2023年间WHO GHO指标人力资源(IHRSPAR2_C06)的国家级观察数据。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖47个非洲国家,共141行数据,区域筛选为WHO AFRO(ParentLocationCode = AFR)。

This dataset contains country-level observations for the WHO GHO indicator Human resources (IHRSPAR2_C06) across African nations, spanning 2021–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with 141 total rows, region filtered as WHO AFRO (ParentLocationCode = AFR).
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区的人力资源指标(IHRSPAR2_C06)。数据集涵盖2021至2023年间47个非洲国家的观测数据,共计141条记录,所有数值均直接提取自API返回的浮点精度字段NumericValue,并同步纳入了置信区间边界值(value_low与value_high),以确保数据精度与统计完整性。数据以Parquet格式存储,采用统一模式(Schema)进行重构,便于机器学习流水线的直接调用。
特点
数据集具备高度结构化与标准化的特点。每条记录包含国家ISO代码、WHO区域信息、观测年份、数值估计及其置信区间、原始显示字符串、维度类型与维度值等关键字段。特别地,对于存在分层维度的指标(如性别或居住地类型),每个国家-年份-维度的组合均作为独立行呈现,使用户能够灵活过滤或聚合特定子群。此外,数据集通过WHO AFRO区域过滤器确保仅收录非洲国家数据,具有明确的区域针对性。
使用方法
用户可通过HuggingFace Datasets库直接加载该数据集,使用`load_dataset("electricsheepafrica/africa-who-human-resources")`命令即可获取训练集,并利用`to_pandas()`方法转换为DataFrame进行进一步分析。对于非分层数据,可过滤`dim1`字段以提取整体国家水平数据;如需时序分析,可依据`country_iso3`列筛选特定国家并按年份排序。数据集的列结构清晰,适合用于表格分类与回归任务,且置信区间字段可辅助不确定性建模或误差分析。
背景与挑战
背景概述
在非洲大陆,公共卫生体系的韧性评估依赖于精准且结构化的人力资源数据,而世界卫生组织(WHO)全球卫生观测站(GHO)长期致力于收集此类关键指标。为应对非洲卫生数据分散、格式不统一的难题,Electric Sheep Africa团队于2023年整合了WHO GHO中涵盖2021至2023年间47个非洲国家的人力资源指标(IHRSPAR2_C06),创建了africa-who-human-resources数据集。该数据集以机器学习的就绪格式呈现,每一条记录均包含数值估计及其置信区间,为追踪非洲卫生工作者密度、分析资源分布不均衡提供了标准化基础。其影响力体现在:填补了非洲大陆级卫生人力资源结构化开放数据的空白,支持流行病学建模和健康政策制定中的定量分析。
当前挑战
该数据集所解决的领域问题核心在于:非洲各国卫生人力资源数据长期以非结构化或国别离散形式存在,难以进行跨年份、跨国别的比较与回归分析,阻碍了针对卫生系统脆弱性的量化评估。在构建过程中,挑战主要包括:原始WHO OData API接口返回的字段存在显示字符串与数值字段混杂的现象,需严格提取NumericValue以保证精度;不同国家数据上报的时间窗口与质量标准不一,导致部分年份记录缺失;此外,将47个国家的ISO代码、区域分类与多维度(如性别、城乡)统一映射至标准范式时,仍需处理亚组标签(如SEX_BTSX)的过滤逻辑问题,以确保数据集的鲁棒性与可复现性。
常用场景
经典使用场景
非洲地区公共卫生人力资源数据集(africa-who-human-resources)是依据世界卫生组织全球卫生观察站数据整理而成,覆盖2021至2023年间47个非洲国家的人力资源指标。该数据集最经典的使用场景在于开展跨国家的卫生人力密度比较分析,通过`value_numeric`字段的浮点估计值,研究者能够系统评估各国在医生、护士等关键卫生人员配置上的差异。此外,数据中附带的高低置信区间边界为不确定性量化提供了宝贵依据,使得区域卫生系统韧性的建模与趋势预测更加可靠。
实际应用
在实际应用中,该数据集能够支撑非洲各国卫生部及国际卫生组织进行精准的资源调配与政策制定。例如,借助完整的数据序列和地区分布信息,决策者可以识别出卫生人力极度匮乏的‘热点’区域,并据此制定针对性的培训与招聘计划。同时,通过与新冠疫情、疟疾等疾病负担数据的交叉分析,卫生管理者可以更好地优化应急响应团队部署,从而提升区域人群健康服务的可及性与公平性。
衍生相关工作
基于该数据集,研究者已开展了一系列衍生工作。其中,利用其时间序列特性进行的非洲卫生人力资源供需预测模型开发是代表性方向之一,相关成果发表在《全球健康科学》等国际期刊上。此外,该数据集还促进了机器学习方法在卫生政策评估中的应用,例如通过随机森林和梯度提升机等算法识别影响卫生人力配置的关键社会经济学因素,并为WHO非洲区域办事处的《卫生人力战略》修订提供了数据驱动的参考依据。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作