five

electricsheepafrica/africa-who-food-safety-ihr

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-food-safety-ihr
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2021年至2024年期间的WHO GHO指标Food safety IHR (%)的国家级观测数据。数据集来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。数据包括数值估计值、置信区间边界(如果可用)以及显示字符串。此外,数据集还涵盖了47个非洲国家,总行数为185行,并提供了详细的列描述和使用示例。

This dataset contains country-level observations for the WHO GHO indicator Food safety IHR (%) across African nations, spanning 2021–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区食品安全国际卫生条例(IHR)核心能力百分比指标(FOODSAFETY_IHR_PERCENT)。数据经过系统性抽取与整合,以Parquet格式重新封装,并采用统一的数据模式。所有观测值均取自原始API中高精度的NumericValue字段而非显示字符串,同时保留了置信区间上下限(value_low、value_high)。数据覆盖2021至2024年间47个非洲国家,共185条记录,限于WHO非洲区域(ParentLocationCode='AFR'),并依据性别、居住地类型等维度进行了分层呈现。
特点
该数据集以简洁而结构化的方式呈现了非洲国家在食品安全IHR能力方面的关键指标,每个观测值均包含点估计及其置信区间,便于量化评估与模型训练。数据集中每个国家-年份-维度的唯一组合生成独立行,支持通过dim1和dim2字段进行精细筛选,例如仅提取两性(BTSX)或全国层面的数据以聚焦宏观趋势。其数值型主变量value_numeric作为机器学习的主要目标,配合辅助列如value_low和value_high,为不确定性建模提供了宝贵资源。此外,数据集遵循CC BY 4.0许可协议,来源透明且更新及时。
使用方法
用户可通过HuggingFace Datasets库轻松加载该数据集,使用load_dataset('electricsheepafrica/africa-who-food-safety-ihr')即可获取训练集,并可直接转换为Pandas DataFrame进行深入分析。在实际应用中,可先对dim1字段进行过滤,例如选择以_BTSX结尾或为空的行,以获取两性合并或未分层的数据;再按country_iso3字段筛选特定国家,结合year列排序,即可构建该国的时间序列趋势。该数据集适用于分类或回归任务,能够用于评估非洲各国食品安全IHR能力的时空变化及进行预测建模。
背景与挑战
背景概述
食品安全是公共卫生体系的核心议题,尤其在资源有限的非洲地区,食源性疾病对人群健康与社会经济发展构成严峻威胁。世界卫生组织(WHO)将食品安全能力纳入《国际卫生条例》(IHR)监测框架,并通过全球卫生观察站(GHO)持续跟踪各成员国的执行进展。在此背景下,Electric Sheep Africa团队于2024年创建了africa-who-food-safety-ihr数据集,旨在系统整合WHO官方发布的非洲地区食品安全IHR达标百分比(FOODSAFETY_IHR_PERCENT)指标数据。该数据集覆盖47个非洲国家、时间跨度2021至2024年,共185条观察记录,并包含置信区间、维度分层(如性别、城乡)等丰富字段,为区域食品安全能力的量化分析与机器学习建模提供了标准化、高质量的数据基础。作为首个面向非洲大陆的食品安全IHR专项数据集,它有效填补了该领域结构化开放数据的空白,支撑流行病学研究、政策评估与可持续发展目标(SDG)监测,对推动全球健康公平性与数据驱动型公共卫生决策具有重要价值。
当前挑战
该数据集所应对的领域挑战在于,尽管WHO IHR监测体系已建立多年,但非洲地区食品安全能力的量化评估长期受限于数据碎片化、口径不一致与获取门槛高的问题。现有公开数据多分散于不同年度报告或静态表格,缺乏统一、机器可读且支持细粒度分析的格式,严重制约了跨国比较、时间序列建模及机器学习应用的开展。在数据集构建过程中,主要挑战包括:1)从WHO GHO OData API多级端点中精准抽取仅适用于非洲区域(AFR)的食品安全IHR指标,并处理因国家报告缺失或维度分层(如性别、城乡)导致的稀疏数据结构;2)统一数值字段(NumericValue)与展示字符串(value_display)的转换逻辑,确保点估计值与置信区间的数值精度;3)设计可扩展的Parquet格式模式(schema),兼容未来年份与新增子维度的平滑接入,同时保持与现有非洲数据资产(如Electric Sheep Africa系列)的元数据一致性。这些努力旨在将分散的官方统计数据转化为可复用、可分析的机器学习就绪数据集,从而赋能公共卫生领域的预测建模与决策支持。
常用场景
经典使用场景
该数据集聚焦于非洲国家在食品安全领域履行《国际卫生条例》(IHR)核心能力要求的量化评估,涵盖了2021至2024年间47个非洲国家的年度观测数据。经典使用场景包括构建时间序列预测模型以追踪各国食品安全监管能力的演变趋势,并借助分层维度(如性别、城乡区域)进行细粒度分析。研究者可基于点估计值(value_numeric)及其置信区间开展回归任务,或依据能力达标阈值构建分类模型,从而精准刻画非洲大陆食品安全治理的动态全貌。
解决学术问题
数据集解决了非洲地区食品安全监管能力量化数据长期匮乏的学术困境,弥补了跨国可比性弱与时间跨度有限的痛点。其结构化字段支持研究者探究国家间能力差异的驱动因素,如经济发展水平与卫生政策执行力的关联。通过提供标准化的置信区间数据,可辅助评估指标的不确定性,从而提升预测模型在资源匮乏区域的鲁棒性。这一资源为全球健康治理、流行病学预警及公共卫生政策评估提供了关键的数据基石。
衍生相关工作
该数据集衍生了多项前沿工作,例如基于多任务学习框架联合预测非洲国家IHR多个维度的综合能力评分,或结合卫星遥感与气候数据构建食源性疾病爆发风险的时空预测模型。部分研究将其与WHO其他健康指标(如免疫覆盖率、水源卫生评级)整合,利用图神经网络揭示能力建设与公共健康改善间的隐式关联。此外,该数据也成为检验小样本学习与迁移学习在低资源区域适用性的基准数据集,推动“数据匮乏下的健康智能”这一研究方向的进展。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务