five

electricsheepafrica/africa-who-dental-assistants-and-therapists

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-dental-assistants-and-therapists
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2024年间关于牙科助理和治疗师(数量)的WHO GHO指标数据(指标代码:HWF_0012)。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集涵盖了43个非洲国家,共209行数据,是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator Dental Assistants and Therapists (number) (HWF_0012) across African nations, spanning 2000–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 43 African nations with a total of 209 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区牙科助理与治疗师的数量指标(HWF_0012)。通过统一的Parquet文件格式,数据集保留了原始API中的浮点精度数值(NumericValue),并将置信区间上下界一并纳入。数据覆盖2000至2024年间43个非洲国家的年度观测,共计209条记录,所有行均经过WHO AFRO区域代码过滤,确保地域一致性与分析聚焦性。
特点
数据集以国家-年份为基本单元,每条观测包含指标代码、国家ISO3代码、WHO区域、年份、数值点估计及其置信区间、显示字符串、维度类型与维度值等字段。尽管该指标本身无子维度(即单数值/国家/年),但schema设计兼容了性别、居住地类型等分层信息,便于未来扩展。数据同时提供了原始数值与格式化字符串,为机器学习与可视化分析提供了灵活选择。
使用方法
使用HuggingFace的datasets库可一键加载数据,转化为pandas DataFrame后,可通过筛选dim1字段末尾为'_BTSX'或空值的方式获取全国性、不分性别的数据。按国家ISO3代码过滤并排序年份,即可获得单个国家的时间序列。数据集的简单结构使其适合直接作为回归或分类任务的输入特征,或用于评估非洲各国牙科人力资源的分布与变迁趋势。
背景与挑战
背景概述
该数据集源自世界卫生组织(WHO)全球卫生观测站(GHO),由Electric Sheep Africa团队整理并发布于HuggingFace平台,创建于2024年,聚焦于非洲地区牙科助理与治疗师数量这一关键卫生人力指标(代码HWF_0012)。核心研究问题旨在揭示2000至2024年间非洲各国牙科辅助人员的分布特征与变迁趋势,覆盖43个非洲国家共209条记录。作为统一化、机器学习就绪的非洲数据仓库的一部分,该数据集为全球卫生人力规划、政策制定及健康不平等研究提供了标准化、可复现的基础支撑,尤其在口腔健康服务能力评估领域具有重要参考价值。
当前挑战
所解决的领域问题在于非洲大陆口腔健康人力数据长期稀缺、分散且缺乏可比性,严重制约了区域卫生系统资源分配与政策干预效果评价。构建过程中的挑战包括:从WHO OData API中提取原始数据并统一清洗为Parquet格式,处理跨越25年的多国面板数据中存在的缺失值与置信区间不完整问题;同时需确保不同国家间定义类别(如性别、城乡地区)的一致性,避免因维度分层导致的混淆。此外,数据集仅包含43国信息,部分国家数据缺失,可能引入样本偏差,影响模型泛化能力与区域级推断的可靠性。
常用场景
经典使用场景
该数据集聚焦于非洲地区牙科助理与治疗师的数量指标(WHO GHO指标HWF_0012),覆盖2000年至2024年间43个非洲国家的年度观测数据。其经典使用场景在于构建时间序列预测模型,用于追踪和推断非洲各国牙科辅助人力的演变趋势。研究者可借助该数据集进行跨国的纵向比较分析,评估不同国家在口腔健康人力资源配置上的差异与动态变化。此外,该数据集为回归任务提供了连续型目标变量(牙科助理与治疗师人数),并附带了置信区间信息,使其在不确定性量化与鲁棒性建模方面具有独特的应用价值。
实际应用
在应用层面,该数据集直接服务于非洲地区卫生系统规划与国际发展组织的决策支持。公共卫生机构与政策制定者可利用该数据评估现有牙科人力配置与人口需求的缺口,优化口腔健康服务网络的布局,例如识别牙科助理与治疗师极度匮乏的国家或地区,并据此分配培训资源与援助资金。世界卫生组织、非洲联盟及各国民政部门均能以此为据,监测“全民健康覆盖”框架下口腔健康人力的进展指标,推动以证据为基础的卫生人力战略落地。
衍生相关工作
该数据集作为“非洲电力羊”(Electric Sheep Africa)统一数据集合的一部分,衍生了一系列聚焦于非洲健康人力资源的机器学习与统计建模工作。相关工作包括:基于该数据构建的牙科人力供给预测模型,用于估计未来十年非洲各国的短缺程度;结合其他卫生人力指标(如医生、护士密度)的多变量分析,揭示牙科人力与其他专业人力之间的协同或替代关系;以及利用地理空间模型,将国别数据降尺度至次国家级区域,填补基层卫生规划的数据空白。这些工作共同推动了非洲健康数据科学从描述性统计向预测性建模的跃迁。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务