five

electricsheepafrica/africa-who-environmental-and-occupational-health-and-hygiene

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-environmental-and-occupational-health-and-hygiene
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站指标“环境与职业健康及卫生专业人员数量”(HWF_0017)在非洲国家的国家层面观察数据,时间跨度为1985年至2024年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据仓库。数据直接从WHO全球健康观察站OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Environmental and Occupational Health and Hygiene Professionals (number)" (`HWF_0017`) across African nations, spanning 1985–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织(WHO)全球卫生观察站(GHO)的OData API,针对非洲地区环境与职业健康与卫生专业人员数量指标(HWF_0017)进行系统性采集与重构。原始数据经标准化处理后,以Parquet格式存储,并纳入Electric Sheep Africa统一数据体系。所有观测值均来自NumericValue字段,确保数值精度,同时保留置信区间上下限(value_low、value_high)以供分析。数据集涵盖1985年至2024年间46个非洲国家的267条记录,每条记录对应一个国家在特定年份的指标观测值,未进行子维度分层。
特点
该数据集最显著的特征在于其高度的结构化与机器学习就绪性。所有字段采用一致的模式设计,包括国家ISO代码、WHO区域、年份、数值估计及置信区间等核心变量,便于直接用于分类与回归任务。数据来源权威且开放,遵循CC BY 4.0许可协议。此外,虽然本指标无子维度分层,但数据模式支持可能的维度扩展(如性别、居住区域),通过dim1/dim2字段实现灵活过滤与聚合分析。
使用方法
用户可通过HuggingFace datasets库便捷加载数据,调用load_dataset函数即可获取训练集格式的DataFrame。推荐使用pandas进行进一步处理,例如通过过滤dim1字段或检查空值来保留全国性、两性合并的基线数据。对于时间序列分析,可按国家代码筛选并依年份排序。该数据集可直接作为监督学习任务的特征或目标变量,亦可用于非洲区域卫生人力资源配置趋势的可视化与统计建模。
背景与挑战
背景概述
在非洲大陆,环境与职业健康问题日益成为公共卫生领域的焦点,其背后的人力资源配置状况直接关系到区域健康治理的成效。世界卫生组织全球卫生观察站(WHO GHO)发布的HWF_0017指标数据集,聚焦于非洲国家1985年至2024年间环境与职业健康与卫生专业人员的数量,由Electric Sheep Africa团队从WHO OData API统一整理为机器学习就绪格式。该数据集覆盖46个非洲国家,共267条观测记录,为研究非洲地区健康人力资本分布、评估政策干预效果提供了稀缺的纵向数据支撑,尤其对理解环境健康与职业防护服务的区域可及性具有重要参考价值。
当前挑战
该数据集所解决的领域问题在于,非洲环境与职业健康人力资源长期缺乏系统量化监测,导致相关决策多依赖粗略估算,难以精准识别薄弱环节。构建中面临的主要挑战包括:原始数据来自WHO多个历史版本,存在指标定义不统一、国家间报告周期不一、部分年份缺失严重等问题;此外,数据粒度仅为国家层面,无法反映城乡或性别等子维度差异(本指标无细分维度),限制了深度分析;且267条样本量极小,对机器学习模型的泛化能力构成显著约束。
常用场景
经典使用场景
该数据集收录了1985年至2024年间46个非洲国家的环境与职业卫生及健康专业人员数量,是机器学习与统计分析中用于回归和分类任务的经典资源。研究者可基于其整洁的表格结构,通过`value_numeric`字段直接建立预测模型,如利用时间维度和国家特征推测专业人员密度的变化趋势,或采用置信区间评估估计的不确定性,为卫生人力建模提供坚实的数据基础。
衍生相关工作
该数据集衍生出一系列以非洲卫生人力为核心的经典研究与工具。Electric Sheep Africa集合以此为基,推动多源WHO指标的统一与机器学习就绪格式的标准化;后续研究进一步结合迁移学习与时空插值技术,补全缺失年份和国家数据,并开发出专注发展中国家的卫生人力预测仪表盘,深化了数据驱动方法在健康人力资本评估领域的应用边界。
数据集最近研究
最新研究方向
依托世界卫生组织全球卫生观察站(GHO)的权威数据,该数据集聚焦于非洲大陆环境与职业健康及卫生专业人员的数量统计,为评估区域公共卫生人力资本配置提供了关键依据。当前前沿研究正借助此类数据驱动机器学习建模,深入分析非洲各国在1985至2024年间的人力资源演变趋势,并结合全球卫生安全、气候变化适应及职业暴露防控等热点议题,量化专业人才短缺对疾病负担和医疗覆盖的影响。这一方向不仅强化了数据驱动的卫生决策支持,还推动了跨学科合作,为联合国可持续发展目标中健康与福祉指标的监测提供了精准工具,具有深远的政策指导与科研创新意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务