electricsheepafrica/africa-who-dentists-hwf0010
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-dentists-hwf0010
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“每10,000人牙医数量”(HWF_0010)在非洲国家的国家级观察数据,时间跨度为1990年至2024年。数据来源于WHO Global Health Observatory的OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。
This dataset contains country-level observations for the WHO GHO indicator "Dentists (per 10,000)" (`HWF_0010`) across African nations, spanning 1990–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(GHO)的开放数据接口,聚焦于非洲地区每万人拥有的牙医数量这一关键卫生人力指标(编码HWF_0010)。项目团队通过OData API系统化抓取原始数据,并将其重封装为兼容机器学习的Parquet文件格式,确保具有一致的列式结构。数据集中所有数值均采用浮点精度的'NumericValue'字段,而非格式化显示字符串,同时保留了置信区间上下限值,为后续的统计分析与模型训练提供了精准的基础数据。
特点
本数据集覆盖了1990年至2024年间47个非洲国家的427条观测记录,所有条目均限定于WHO非洲区域(AFRO)。其列式架构设计精良,包含指示代码、国家ISO代码、WHO区域、观测年份、核心数值以及置信区间等关键字段,并兼容维度分层信息。由于该指标为单一数值,不存在按性别或年龄的亚组划分,因此每个国家与年份的组合对应唯一记录,这种简洁性降低了数据清洗的复杂度,使其尤其适合时间序列预测与区域比较分析。
使用方法
使用者可通过HuggingFace的'load_dataset'函数便捷加载该数据集,并将其转换为Pandas DataFrame以进行后续操作。针对仅需国家级且不分性别的分析场景,推荐通过过滤'dim1'字段以提取以'_BTSX'结尾或为空的行。对于特定国家的时间序列研究,可按照国家ISO代码筛选并依年份排序。该数据集还预留了置信区间的字段,便于在回归或分类任务中引入不确定性量化,从而提升模型的可解释性与鲁棒性。
背景与挑战
背景概述
该数据集名为africa-who-dentists-hwf0010,由Electric Sheep Africa团队于2024年基于世界卫生组织全球卫生观察站(WHO GHO)的开放数据重新打包而成,聚焦于非洲地区每万人牙医数量的核心卫生人力指标(HWF_0010)。数据集涵盖1990至2024年间47个非洲国家的427条观测记录,旨在为机器学习研究提供结构统一、可直接使用的标准化表格数据。作为非洲健康数据统一仓库的一部分,该数据集填补了该区域卫生人力领域高质量、开放获取数据集稀缺的空白,对于推动非洲卫生政策制定、资源分配优化及全球卫生人力比较研究具有重要基础性支撑作用,尤其在牙科保健服务可及性与区域不平等分析的量化研究中展现出关键价值。
当前挑战
该数据集所解决的领域问题在于非洲地区牙医密度数据的碎片化与低可用性,长期制约着对区域口腔卫生服务能力与人力分布的精准评估。在数据构建过程中,主要挑战来自WHO GHO OData API的原始数据格式异构与缺失值问题,需统一提取浮点精度的数值字段而非显示字符串,并保留置信区间边界信息以支持后续不确定性分析。此外,跨1990至2024年的大跨度时间序列中,不同国家、年份的观测记录存在不均衡覆盖,部分数据点缺失导致时间序列不连续;而47个国家的国别差异与无分层子维度(如性别、城乡)的单一指标结构,进一步限制了模型对卫生人力分布深层异质性因素的抓取能力,亟需在后续研究中引入增强性特征工程或辅助数据源以弥补这一不足。
常用场景
经典使用场景
在公共卫生与流行病学研究中,非洲地区牙科人力资源的密度指标是评估区域口腔医疗服务可及性的关键变量。该数据集提供了非洲47个国家在1990至2024年间每万人拥有的牙医数量,作为标准化的人口健康资源度量,常被用于跨国比较分析、时间序列趋势建模以及健康系统效能评估。研究人员可借助该数据构建回归模型,探索牙医密度与口腔疾病负担、经济发展水平或卫生支出之间的关联,亦可用于聚类分析以识别医疗服务资源匮乏的高风险区域。
衍生相关工作
基于该数据集衍生出的经典工作包括构建非洲口腔健康人力资源预测模型,融合经济、人口与疾病负担指标预测未来牙医需求缺口;以及开发交互式可视化仪表盘,动态展示各国牙医密度的历史变迁与跨国排名。部分研究将其与世卫组织其他人力资源指标(如护士密度、医师密度)整合,开展非洲卫生人力综合配置的多维分析。这些衍生工作不仅拓展了原始数据在健康系统建模中的应用深度,也为后续学者提供了可复用的方法论框架与基准数据集。
数据集最近研究
最新研究方向
基于世界卫生组织全球卫生观察站数据,非洲口腔健康人力密度(每万人牙医数)数据集正被整合至机器学习驱动的公共卫生监测体系中。随着非洲大陆口腔疾病负担加剧与世卫组织《非洲口腔健康区域战略》的推进,该指标成为评估初级卫生保健系统韧性的关键代理变量。当前前沿研究聚焦于利用该时间序列数据(1990-2024年,覆盖47国)构建地理加权回归与时空贝叶斯模型,以揭示牙医资源配置不均与龋齿、牙周病等非传染性疾病流行之间的动态关联。数据集提供的置信区间使研究者能稳健地量化非洲区域内医疗人力资源的波动性与缺口,为国际发展机构优化卫生援助分配、实现全民健康覆盖目标提供数据驱动的决策依据。
以上内容由遇见数据集搜集并总结生成



