electricsheepafrica/africa-who-community-health-workers
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-community-health-workers
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家WHO GHO指标“社区健康工作者(数量)”(HWF_0024)的国家级观测数据,时间跨度为1995年至2024年。它是Electric Sheep Africa系列的一部分,这是一个统一、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Community Health Workers (number)" (`HWF_0024`) across African nations, spanning 1995–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,专注于非洲地区社区健康工作者数量的指标HWF_0024。由Electric Sheep Africa团队重新打包整理,将原始数据转化为统一的Parquet文件格式,保留了浮点精度的数值字段(NumericValue)作为主要数据来源,并整合了置信区间上下界等辅助信息。数据集涵盖了1995年至2024年间44个非洲国家的216条观测记录,每个国家与年份的组合对应唯一一行数据,确保了时间序列的连续性与地理覆盖的完整性。
使用方法
用户可通过HuggingFace Datasets库便捷加载数据,调用`load_dataset`函数即可获取完整数据集,并进一步转换为Pandas DataFrame进行后续处理。使用方法包括过滤只保留全国总体估计(如仅选择Sex_BothSexes或无维度分层的数据行),以及按国家代码筛选特定国家的时间序列(如`country_iso3 == 'KEN'`)。该设计使得后续训练、验证或统计分析流程均能无缝衔接,极大降低了数据获取与预处理的门槛。
背景与挑战
背景概述
在撒哈拉以南非洲地区,社区健康工作者是初级卫生保健体系的关键支柱,其数量直接影响疾病防控与母婴健康等可持续发展目标的实现。然而,长期以来,该地区缺乏系统化、机器可读的健康人力数据,制约了跨国比较研究与政策评估。为此,世界卫生组织于2024年通过全球卫生观察站发布了“社区健康工作者数量”指标(HWF_0024),并由Electric Sheep Africa团队重新封装为机器学习就绪的数据集。该数据集覆盖1995至2024年间44个非洲国家的216条观测记录,聚焦于社区健康工作者的绝对数量这一核心变量,旨在为卫生人力规划、资源分配建模及跨区域趋势分析提供标准化数据基础。作为首个面向非洲大陆的统一社区健康工作者数据仓库,该数据集显著降低了时空分析的门槛,推动了计算社会科学与全球健康交叉领域的研究发展。
当前挑战
该数据集所解决的领域问题在于填补非洲社区健康工作者量化数据的空白——传统统计资料常因国家定义差异、报告时间不统一或数据缺失导致比较失效,而本数据集通过标准化指标代码与置信区间字段,为预测健康工作者密度、评估政策干预效果提供了可靠输入。然而,构建过程中面临多重挑战:首先,WHO原始API返回的数据存在年份稀疏性,44国在30年间仅累计216条记录,部分国家仅在个别年份有观测,导致时间序列不完整;其次,数据来源仅提供点估计与置信区间,缺乏更细粒度的城乡或性别分层汇总,限制了亚群分析潜力;此外,不同国家对“社区健康工作者”的定义差异未被显式编码,潜在的概念异质性可能影响跨模型泛化性能。
常用场景
经典使用场景
在非洲公共卫生与全球健康治理的研究语境中,该数据集作为世界卫生组织全球卫生观察站(WHO GHO)标准化指标'社区健康工作者数量'(HWF_0024)的时空汇编,为学者提供了跨越三十载(1995–2024)涵盖44个非洲国家的结构化纵向面板数据。经典使用场景聚焦于利用时间序列与横截面相结合的分析框架,刻画非洲各国社区健康工作者人力资源的配置格局与动态演变轨迹,从而构建区域健康人力资本的基础性知识图谱。
解决学术问题
该数据集精准回应了非洲健康系统研究中长期存在的'数据荒漠化'困境,即微观与宏观层面健康人力指标的可比性与可获取性严重不足。通过统一编码、数值与置信区间并存的严谨架构,它破解了跨国家、跨时段的比较分析障碍,使研究者得以系统评估社区健康工作者分布的不平等性、探讨其与初级卫生保健覆盖率的关联机制,并验证健康人力投资对可持续发展目标(SDGs)的驱动效应,从而推动循证卫生政策研究迈向更可靠的量化范式。
实际应用
在实际决策层面,该数据集为非洲各国卫生部及国际发展机构(如WHO、UNICEF)提供了可操作的数据基石,用于监测社区健康工作者队伍的规模扩张或萎缩趋势,识别服务能力薄弱的地区与时间窗口。基于这些数据,政策制定者能够校准人力资源的分配方案,优化基层卫生筹资策略,并在疟疾、艾滋病及孕产妇健康等垂直项目中量化干预的人力需求缺口,最终增强非洲面向全民健康覆盖(UHC)的路径规划能力。
数据集最近研究
最新研究方向
在全球公共卫生体系不断强化基层医疗能力的背景下,非洲社区卫生工作者(CHWs)的数量变化成为衡量初级卫生保健可及性与人力资源配置的关键指标。该数据集基于WHO全球卫生观察站(GHO)的官方数据,覆盖44个非洲国家长达近三十年的社区健康工作者数量统计,为解析非洲大陆卫生人力分布、识别基层医疗覆盖缺口以及评估卫生健康体系韧性提供了宝贵的时间序列素材。当前前沿研究方向聚焦于利用该数据训练机器学习模型,以预测CHWs数量与经济、疾病负担及政策干预间的动态关联,同时结合地理空间分析,揭示CHWs分布的空间异质性与不平等性,助力世卫组织及各国卫生部门优化资源配置与决策支持。
以上内容由遇见数据集搜集并总结生成



