five

electricsheepafrica/africa-who-medical-doctors-hwf0001

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-medical-doctors-hwf0001
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“每10,000人中的医生数量”(HWF_0001)在非洲国家的国别观察数据,时间跨度为1990年至2024年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Medical doctors (per 10,000)" (`HWF_0001`) across African nations, spanning 1990–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)OData API,针对非洲47个国家,整合了1990年至2024年间“每万人拥有医生数量”(HWF_0001)这一关键卫生人力指标。原始数据经规范化处理后,以Parquet格式存储,保留了浮点精度的数值字段(NumericValue)作为机器学习主要目标,并附带了可用的置信区间上下界,构建过程确保了数据结构的一致性与可复现性。
特点
数据集具有明确的时空覆盖特性,包含585条观测记录,聚焦于世卫组织非洲区(AFRO)的国家层级数据。其特点在于无子维度拆分,每个国家每年对应单一数值,简化了分析复杂度。同时,数据集中包含了标准化的ISO国家代码、WHO区域标识以及最后更新时间戳,便于跨数据集整合与时间序列分析,为非洲区域卫生人力评估提供了可靠的量化基础。
使用方法
用户可通过Hugging Face `datasets`库便捷加载数据集,例如使用`load_dataset('electricsheepafrica/africa-who-medical-doctors-hwf0001')`获取训练集,并转换为Pandas DataFrame进行后续处理。推荐过滤`dim1`列中值为`SEX_BTSX`或空值的行,以获取全国男女合计数据。对于特定国家的时间序列分析,可依据`country_iso3`列筛选并排序年份,适用于回归或分类建模任务。
背景与挑战
背景概述
在全球健康治理体系中,卫生人力资源是衡量医疗服务可及性与系统韧性的核心维度。由世界卫生组织全球卫生观察站(WHO GHO)发布的“每万人医生数”(HWF_0001)指标,长期被视为评估国家卫生系统能力的关键基准。Electric Sheep Africa团队于2024年整合并发布了africa-who-medical-doctors-hwf0001数据集,覆盖47个非洲国家1990至2024年的观测数据,将其从官方API转化为机器学习就绪的Parquet格式。该数据集聚焦于非洲区域医生密度的时空演化,为研究非洲卫生不平等、政策干预效果及可持续发展目标(SDG)指标3.c.1的进展提供了标准化的量化基础。其结构化框架(包含置信区间与维度标签)显著提升了跨国比较研究的可复现性,对全球卫生经济学与流行病学建模领域具有重要影响。
当前挑战
该数据集所应对的领域挑战在于:非洲大陆长期面临卫生人力资源分布不均与数据碎片化的问题,传统官方统计存在国家间定义差异、时间序列不连续以及分层数据(如性别、城乡)缺失等障碍,致使精准的区域卫生规划与机器学习建模缺乏一致可靠的输入。在构建层面,挑战体现为多源异构数据的对齐与清洗:需处理WHO OData API中不同指标代码与可变维度结构,从包含缺失值、显示字符串与数值字段混杂的原始响应中提取纯浮点型指标,并保留置信区间;同时协调47个国家在34年跨度内观测数量的不均衡(总585行),确保时空稀疏性不影响下游模型训练。此外,跨版本元数据(如last_updated字段)的同步管理也增加了工程复杂性与数据溯源难度。
常用场景
经典使用场景
该数据集聚焦于非洲国家每万人拥有的医生数量,是评估区域医疗卫生人力资源配置的核心指标。在经典使用场景中,研究者将其作为关键因变量或解释变量,用于构建面板数据模型,分析非洲各国医疗卫生系统的发展水平及其随时间演变的趋势。数据覆盖47个非洲国家1990至2024年的观测值,提供了丰富的时空维度,使得纵向比较与跨国差异分析成为可能。
实际应用
实际应用方面,该数据集可直接服务于国际卫生组织、各国卫生部及非政府组织的政策制定与规划工作。通过分析医生密度的时空分布,决策者能够识别医疗人力资源匮乏的“热点”地区,优化医学教育投资与人才引进策略。同时,该数据可作为联合国可持续发展目标(SDG 3.c)中“加强卫生筹资、招聘、发展、培训和留用卫生人力”进展监测的关键输入。
衍生相关工作
基于该数据集,衍生出一系列与非洲卫生人力相关的建模和分析工作。研究者构建了预测模型,用以估算未来十年非洲大陆医生密度的变化轨迹;发展出空间统计方法,描绘医生分布与地理可达性之间的交互模式。此外,该数据常与WHO其他指标(如疟疾发病率、孕产妇死亡率)联合使用,形成综合性公共卫生分析框架,推动跨学科研究向更深层次发展。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务