five

electricsheepafrica/africa-who-food-safety

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-food-safety
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2021年至2023年间关于食品安全的WHO GHO指标(IHRSPAR2_C13)的国家级观测数据。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察站OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了47个非洲国家,总共有141行数据。

This dataset contains country-level observations for the WHO GHO indicator Food safety (IHRSPAR2_C13) across African nations, spanning 2021–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 141 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,由Electric Sheep Africa团队统一整理与重构。原始数据中的食物安全指标(代码IHRSPAR2_C13)经筛选后,聚焦于非洲区域的47个国家和地区,时间跨度为2021年至2023年。所有观测值均采用数值型字段(NumericValue)而非显示字符串表示,确保数据精度。数据以Parquet格式存储,并附带一致的列式结构,同时保留了置信区间上下限(value_low、value_high)等辅助信息,以备后续统计推断之需。
特点
此数据集共包含141条记录,每条记录对应一个特定国家在特定年份的单一数值型观测结果,无需进行亚维度分层处理,结构简洁明了。数据集不仅提供了点估计值,还纳入了置信区间范围,便于评估指标的不确定性。其列式Schema设计规范,涵盖指标编码、国家ISO代码、年份、数值及置信区间等多个维度,支持灵活的数据筛选与分析。数据来源可靠,遵循CC BY 4.0许可协议,具备明确的开放性和可复现性,是非洲区域食物安全量化研究的优质基础资源。
使用方法
用户可通过HuggingFace的datasets库直接加载该数据集,例如使用`load_dataset("electricsheepafrica/africa-who-food-safety")`命令。加载后,数据以默认的'train'分区呈现,便于转换为Pandas DataFrame进行后续操作。针对需要按性别或居住地类型进行分层的场景,可通过过滤dim1或dim2字段实现精准切片。若仅关注全国层面的两性总体数值,可筛选以'_BTSX'结尾或缺失dim1值的行。此外,用户还可按国家ISO代码(如'KEN'代表肯尼亚)提取特定国家的时间序列数据,并按年份排序以进行趋势分析。
背景与挑战
背景概述
食品安全是全球公共卫生领域的关键议题,尤其在非洲大陆,食源性疾病对社会经济与人口健康构成严峻挑战。世界卫生组织(WHO)全球卫生观察站(GHO)自2021年起系统收集非洲国家的食品安全指标数据,并于2023年由Electric Sheep Africa团队整合为机器学习就绪的数据集。该数据集覆盖47个非洲国家的2021至2023年观测值,提供可量化的食品安全度量,为区域健康政策分析、跨国家比较及预测建模提供了基础。作为非洲健康数据统一存储库的一部分,该数据集促进了数据驱动决策,弥补了非洲大陆在食品安全领域系统性数据资源的空白,对推动可持续发展目标中的健康福祉具有深远影响。
当前挑战
该数据集所解决的领域问题在于,非洲食品安全长期面临监测数据稀疏、指标不统一及可获取性差的困境,阻碍了区域风险评估与干预策略的制定。通过构建标准化、可机器学习的表格数据,该数据集使研究人员能够利用时间序列与回归模型分析食品安全趋势。然而,数据构建过程中面临挑战:一是数据来源依赖WHO的OData API,需处理不同更新频率与缺失值;二是仅有141条记录且覆盖年限短,导致样本量有限,难以支撑复杂模型的训练;三是部分国家数据缺失,且置信区间信息不完整,限制了统计推断的鲁棒性;四是数据粒度粗放,缺乏性别、城乡等亚维度分层,无法深入挖掘社会人口因素对食品安全的影响。
常用场景
经典使用场景
在食品安全监测与公共卫生决策研究中,该数据集最经典的使用场景是作为非洲国家层面食品安全状况的定量分析基础。研究者可依托其中覆盖47个国家、跨越2021至2023年的结构化年度观测值,开展时序趋势分析、区域间比较研究及食品安全绩效评估。由于数据以整洁的Parquet格式提供,并包含点估计值与置信区间,学者能够便捷地将其接入机器学习流水线,用于构建预测模型或分类任务,从而直观揭示非洲大陆食品安全保障能力的动态演变与空间异质性。
衍生相关工作
围绕该数据集,衍生出一系列富有影响力的研究与实践工作。一方面,它被嵌入Electric Sheep Africa统一数据仓库后,催生了面向非洲健康领域的多指标联合分析范式和跨数据集迁移学习基准任务。另一方面,基于其简洁规范的架构,研究者可以复现世界卫生组织年度报告中的核心结论,并将其拓展为可交互式探索的仪表盘或低资源环境下的实时监测系统。此外,该数据还常被用作食品安全领域时序模型(如Prophet、LSTM)的验证集,推动非洲本土化预测工具的迭代,最终助力构建更具韧性的全球健康数据生态。
数据集最近研究
最新研究方向
在非洲公共卫生监测体系中,食品安全数据集的构建正成为评估区域卫生应急能力的关键突破口。该数据集基于世界卫生组织全球卫生观测站的IHRSPAR2_C13指标,整合了2021至2023年间47个非洲国家的年度食品安全数值,并辅以置信区间边界信息,旨在为机器学习驱动的预测建模与区域风险态势感知提供标准化、可直接使用的结构化数据基底。随着国际卫生条例(IHR)对监测数据实时性与可比性要求的不断提升,此类精炼、可复用的开放数据集正推动非洲地区的食品安全研究从零散的个案报告向跨国的统计推断与时空分析转型,为及早发现食品相关事件、优化应急资源配置提供了实证支撑与算法入口。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务