electricsheepafrica/africa-who-radiation-emergencies
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-radiation-emergencies
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2021年至2023年期间的世界卫生组织全球健康观察站(WHO GHO)指标辐射紧急情况(IHRSPAR2_C15)的国家级观测数据。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察站OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Radiation emergencies (IHRSPAR2_C15) across African nations, spanning 2021–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO Global Health Observatory)的OData API,围绕“辐射紧急事件”(Radiation emergencies)这一核心指标(IHRSPAR2_C15)进行构建。数据覆盖2021至2023年间47个非洲国家的年度观测记录,共计141行。所有数值均采用浮点精度的原始数值字段(NumericValue),而非格式化显示字符串,同时收录了置信区间上下界(value_low, value_high)。原始数据经统一架构重构为Parquet格式,确保了机器学习任务的可直接调取与一致性。
特点
该数据集的特点在于其专注于非洲区域(WHO AFRO)且粒度统一,每个国家与年份组合仅对应一条记录,无额外的子维度分层,简化了分析与建模的复杂性。数据表中包含indicator_code、country_iso3、year、value_numeric等13个标准化字段,覆盖点估计值、置信区间、显示字符串及更新时间戳。这种简洁而完整的设计使其非常适合作为时间序列预测、国家间对比回归或分类任务的直接输入。
使用方法
使用者可通过HuggingFace的`datasets`库一键加载数据集,核心接口为`load_dataset("electricsheepafrica/africa-who-radiation-emergencies")`,返回的DataFrame可直接用于探索性分析与模型训练。对于需要关注全国性且双性混合数据的场景,可借助`dim1`字段过滤出以`_BTSX`结尾或为空的行,以获取基准估计值。此外,通过对`country_iso3`列筛选指定国家并按`year`排序,即可提取特定国家的时间序列,便于纵向趋势研究。
背景与挑战
背景概述
在全球公共卫生治理的宏大图景中,辐射应急准备能力是衡量国家卫生安全体系韧性的关键维度。世界卫生组织全球卫生观察站(GHO)自2021年起系统收集非洲地区各国辐射应急响应能力的结构化数据,旨在填补该地区在核与辐射安全监测领域的长期数据鸿沟。该数据集由Electric Sheep Africa团队基于WHO官方OData API重新整合打包,形成了覆盖47个非洲国家、时间跨度为2021至2023年的高质量表格化数据资源。其核心研究问题聚焦于量化非洲大陆在辐射紧急事件中的准备态势,为跨国比较、政策干预效果评估及机器学习驱动的预测建模提供了标准化基础。这一数据仓库的建立,对于理解发展中国家在非传统安全威胁下的卫生系统脆弱性具有里程碑式的意义。
当前挑战
该领域面临的首要挑战在于非洲地区辐射应急基础设施的异质性与数据稀疏性:许多国家缺乏系统的报告机制,导致141条观测记录中数据缺失与置信区间宽泛现象普遍存在。构建过程中,技术团队需解决多源异构数据融合的难题——WHO原始API返回的NumericValue与显示字符串之间的精度差异、不同年份数据收录标准的不连续性、以及国家编码与地区归类的规范性冲突,均对数据清洗提出了严苛要求。此外,该指标无子维度划分(单一值每国家-年份),限制了分层分析的可能性;加之观测样本量不足千条,使得基于此类数据训练的机器学习模型极易面临过拟合风险,在跨区域泛化能力上存在显著瓶颈。
常用场景
经典使用场景
该数据集汇集了2021至2023年间非洲47个国家在辐射应急准备能力方面的关键指标,为跨国比较与时间序列分析提供了标准化数据基础。研究人员常将其用于构建分类或回归模型,以评估各国在《国际卫生条例》框架下应对辐射紧急事件的能力水平。数据集中包含的点估计值与置信区间,使得模型训练既能捕捉趋势,又能量化不确定性,为预测性公共卫生监测提供了宝贵的结构化输入。
解决学术问题
数据集直面非洲地区辐射应急能力数据匮乏且碎片化的学术困境,通过统一WHO全球卫生观察站的指标体系,为研究辐射事件响应机制的区域差异提供了量化依据。它解决了跨年份、跨国别数据一致性不足的问题,使得学者能够系统分析低收入国家在辐射防护基础设施上的薄弱环节,进而探讨资源分配、政策干预与应急成效之间的内在关联,对完善全球卫生安全治理框架具有重要学术推动意义。
衍生相关工作
该数据集衍生出一系列聚焦非洲卫生应急预测与归因分析的经典工作。研究者基于此数据构建了随机森林与梯度提升模型,揭示影响应急能力的关键社会经济变量;亦有团队将其与人口密度、核设施分布等外源数据融合,开展空间聚类分析,识别出高风险走廊地带。此外,部分工作利用多指标联合建模,探讨辐射应急能力与传染病监测体系之间的协同效应,推动了综合卫生安全评估方法论的演化。
以上内容由遇见数据集搜集并总结生成



