electricsheepafrica/africa-who-midwifery-personnel

Name: electricsheepafrica/africa-who-midwifery-personnel
Creator: electricsheepafrica
Published: 2026-04-30 11:50:53
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/electricsheepafrica/africa-who-midwifery-personnel

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含非洲国家在1985年至2024年间关于世界卫生组织全球健康观察站（WHO GHO）指标“助产人员数量”（HWF_0009）的国家级观测数据。它是Electric Sheep Africa集合的一部分，这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察站的OData API，并以Parquet文件的形式重新打包，具有一致的架构。所有数值均来自NumericValue字段（浮点精度字段），而非显示字符串。在可用的情况下，还包括置信区间边界（value_low，value_high）。

This dataset contains country-level observations for the WHO GHO indicator "Midwifery personnel (number)" (`HWF_0009`) across African nations, spanning 1985–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.

提供机构：

electricsheepafrica

搜集汇总

数据集介绍

构建方式

本数据集源自世界卫生组织全球卫生观察站（WHO GHO）的开放数据API，聚焦于非洲地区助产人员数量这一关键指标（HWF_0009）。原始数据经过系统性的抽取与整合，以Parquet文件格式进行重新封装，并采用一致的字段架构，确保数据在机器学习任务中的直接可用性。所有观测值均来源于浮点精度的NumericValue字段，而非显示字符串，同时保留了置信区间上下限（value_low、value_high）等辅助信息，为后续统计推断提供了坚实基础。覆盖1985年至2024年间46个非洲国家的356条记录，形成了专为非洲健康领域研究设计的结构化数据集。

使用方法

使用者可通过HuggingFace的datasets库便捷加载数据，运行`load_dataset('electricsheepafrica/africa-who-midwifery-personnel')`即可获得训练集。返回的数据框可直接转换至Pandas进行深度分析，例如通过`df['dim1'].str.endswith('_BTSX')`条件过滤出不分性别的全国性数据，或利用`df[df['country_iso3'] == 'KEN']`提取肯尼亚的时间序列。对于需要回归或分类任务的场景，`value_numeric`字段可作为目标变量，而`year`与`country_iso3`等字段则可作为特征或分组依据。数据已剔除显示字符串干扰，适合直接输入模型进行训练与预测。

背景与挑战

背景概述

该数据集源自世界卫生组织全球卫生观察站（WHO GHO），由Electric Sheep Africa团队整理并发布于HuggingFace平台，旨在为非洲地区的助产士人力资源状况提供一个统一、机器学习就绪的数据资源。作为全球公共卫生领域的关键指标，助产人员数量直接关系到孕产妇与新生儿健康服务的可及性与质量，尤其在撒哈拉以南非洲地区，这一数据对于评估卫生系统韧性、制定人力资源政策具有不可替代的基石作用。数据集覆盖1985至2024年间46个非洲国家的年度观测值，合计356条记录，其时间跨度之长与国家覆盖之广，为纵向比较与区域分析提供了珍贵的数据基础，显著推动了非洲卫生人力研究的量化进程。

当前挑战

该数据集所面临的挑战首先体现在领域问题的复杂性上：助产人员数量仅是卫生人力资源的一个侧面，单独使用时难以全面反映服务质量、分布均衡性或培训水平，需与卫生支出、病患结局等多维数据联合分析。在构建过程中，数据稀疏性与不规则缺失是主要障碍——356条记录横跨40年与46国，年际与国家间数据点极不均匀，部分国家多年份无观测值，直接限制了时间序列建模与面板数据分析的有效性。此外，WHO原始数据以多种格式存储（如显示字符串与数值字段并存），清洗与标准化过程中需谨慎处理置信区间界值的提取，且亚维度（如性别、城乡分层）的存在增加了数据整合的复杂度，对机器学习模型的鲁棒性提出了更高要求。

常用场景

经典使用场景

该数据集记录了1985至2024年间非洲46个国家的助产士人员数量，源自世界卫生组织全球卫生观察站。作为一项关键的卫生人力指标，它常被用于开展跨国时间序列分析，揭示非洲大陆助产士人力资源的演变趋势与地域差异。研究者可借此评估各国在扩大助产士队伍方面的政策成效，或将其作为核心变量纳入卫生系统能力建模，探讨其与孕产妇死亡率、新生儿健康结局等指标间的关联。数据集结构简洁统一，包含点估计值与置信区间，便于直接用于机器学习中的回归与分类任务。

解决学术问题

在学术层面，该数据集的核心价值在于填补了非洲助产士人力资源量化研究的空白。它使得研究者得以系统分析助产士数量随时间与空间的变动模式，识别人员配置不足或失衡的高风险区域。基于这些数据，学者能够构建预测模型，探索社会经济、政策投入等因素对卫生人力发展的驱动或制约作用。此外，通过与其他健康产出数据集融合，可深入揭示助产密度与母婴健康改善之间的因果路径，为全球卫生治理中的资源配置提供实证支持。

实际应用

在实际应用中，该数据集是国际卫生组织、非洲各国卫生部门及非政府组织规划人力资源战略的重要依据。例如，可用于识别助产士严重短缺的国家或地区，指导国际援助和培训项目的优先投放。在机器学习框架下，它能够支撑预测模型，预估未来数年人员增长趋势，辅助制定可持续的卫生人力培养与留任政策。同时，数据集的时间跨度与标准格式使其便于集成到健康信息系统或决策仪表盘中，促进数据驱动的循证管理。

数据集最近研究