five

electricsheepafrica/africa-who-environmental-and-occupational-health-inspectors-and

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-environmental-and-occupational-health-inspectors-and
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在1985年至2024年间关于环境与职业健康检查员及助理(数量)指标的观测数据,指标代码为HWF_0018。数据来源于世界卫生组织全球健康观察站OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自浮点精度字段NumericValue,而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。该数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator Environmental and Occupational Health Inspectors and Associates (number) (HWF_0018) across African nations, spanning 1985–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,经由Electric Sheep Africa项目整合与重封装,专注于非洲大陆的环境与职业健康检查员及助理人员数量(指标代码HWF_0018)。数据以Parquet格式存储,采用统一的列式架构,保留原始API中的浮点精度数值字段(NumericValue)作为核心指标值,并纳入置信区间上下限(value_low、value_high),覆盖1985年至2024年间41个非洲国家的119条观测记录,所有条目均通过WHO AFRO区域代码(ParentLocationCode = 'AFR')进行过滤筛选。
特点
该数据集的核心特质在于其简洁而规范的单一维度结构——每个国家与年份的组合仅对应一条无分层维度的记录,避免了复杂分组带来的歧义,适合直接用于时间序列分析与回归建模。数据列设计清晰,包含指示符代码、国家ISO3代码、WHO区域、年份、数值估计及其置信区间、格式化显示字符串以及更新时间戳,缺失值以NaN表示,确保了机器学习任务中的兼容性与易用性。尤为突出的是,数据集已过滤为非洲区域,为聚焦该大陆公共卫生人力研究的学者提供了高度定制化的基础数据源。
使用方法
使用者可通过HuggingFace的datasets库便捷加载数据,执行‘load_dataset(\"electricsheepafrica/africa-who-environmental-and-occupational-health-inspectors-and\")’命令即可获取训练集,并利用to_pandas()方法转换为DataFrame以便进一步处理。针对不同分析需求,推荐筛选dim1列中以‘_BTSX’结尾或为缺失值的行以获得全国性两性合计数据;若需单国时间序列,则可按country_iso3与year列排序过滤。此外,数据列中已保留置信区间字段,便于开展不确定性量化或元分析等高级统计应用。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)于2024年发布,经Electric Sheep Africa团队重新打包为机器学习友好的格式,聚焦非洲地区环境与职业健康检查员及助理人员数量这一关键指标(HWF_0018)。数据集覆盖1985年至2024年间41个非洲国家的年度观测数据,共计119条记录,旨在量化非洲大陆在环境与职业健康领域的人力资源配置情况。作为非洲健康数据统一化、可复用基础设施建设的重要一环,它为流行病学研究、卫生政策制定及全球健康不平等分析提供了标准化、可比较的基础数据,尤其在推动非洲区域卫生人力监测与可持续发展目标评估方面具有显著影响力。
当前挑战
该数据集面临的核心挑战包括:一是领域问题层面,环境与职业健康检查员的分布数据长期缺失或零散不统一,难以支撑对非洲国家卫生系统脆弱性的精准评估,尤其是如何将稀疏的、非连续的时间序列数据转化为可驱动政策决策的洞见。二是数据构建过程中,原始数据来源于WHO多来源整合的OData API,存在国家间报告周期不一致、部分年份数据缺失、置信区间不完整等问题,例如119条记录中许多年份仅有单一数值而缺乏变异度度量。此外,数据维度单一(仅包含国家-年份两层),缺乏性别、城乡等亚组分层信息,限制了对其内部异质性的深入剖析。
常用场景
经典使用场景
在非洲公共卫生与职业健康研究领域,该数据集作为世界卫生组织全球卫生观察站的核心指标之一,记录并量化了非洲国家1985至2024年间环境与职业健康检查员及相关人员的数量分布。其最经典的用法源于其时空维度下的结构化特征——通过整理41个非洲国家、跨越近四十年的年度观测值,研究者可以构建国家级卫生人力资源的时间序列面板数据,分析检查员配置的区域差异、变迁趋势及政策应对效果。由于数据直接来源于WHO官方OData API,并以Parquet格式统一提供,结合其数值型精度字段和置信区间信息,使得机器学习模型可直接将'value_numeric'列作为回归或分类任务的目标变量,研究非洲职业健康监管能力的动态演化特征。
衍生相关工作
该数据集的出现催生了一系列围绕非洲卫生人力建模与预测的衍生研究。基于其整理好的多国时间序列,研究人员开发了用于预测未来检查员数量的轻量级回归模型,如使用岭回归或梯度提升树对经济水平、医疗开支与人力增长之间的时序关系进行拟合。该数据也被集成至全球卫生计量网络之中,成为健康人力指标预测的对比基准集。此外,有学者利用该数据集对非洲国家间检查员配置的不平等程度进行基尼系数测算,推动了'卫生人力地理公平性'这一子议题的系统量化研究。这些衍生工作反过来也持续验证和拓展了原数据集在非洲卫生体系分析中的解释力与影响力。
数据集最近研究
最新研究方向
在非洲公共卫生领域,该数据集聚焦于环境与职业健康检查员及助理人员的时空分布与动态演变,为评估劳动力配置与健康安全治理能力提供关键定量依据。前沿研究多结合WHO全球卫生观察站的历史统计框架,借助机器学习和时间序列分析,探索各国人力密度与环境健康风险之间的关联。当前,受全球职业卫生监管加强和非洲大陆疾病负担转型的影响,这类精细粒度的指标正被用于预测卫生系统脆弱性和制定循证政策。该数据集以标准化Parquet格式呈现,并辅以置信区间字段,极大便利了模型训练与流行病学建模,成为连接传统官方统计与当代数据科学实践的重要桥梁。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务