electricsheepafrica/africa-who-average-death-rate-due-to-natural-disasters
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-average-death-rate-due-to-natural-disasters
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含WHO GHO指标“因自然灾害导致的平均死亡率(每10万人口)”(SDGDISASTER)在非洲国家的国家级观测数据,时间跨度为2005年至2021年。它是Electric Sheep Africa系列的一部分,这是一个统一、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Average death rate due to natural disasters (per 100 000 population)" (`SDGDISASTER`) across African nations, spanning 2005–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家因自然灾害导致的平均死亡率(每10万人口)。数据涵盖2005年至2021年间38个非洲国家的观测值,总计379条记录。数据集由Electric Sheep Africa项目进行统一整理与封装,采用Parquet格式存储,并遵循一致的字段结构。所有数值均取自API返回的浮点精度字段NumericValue,而非显示字符串,同时保留了置信区间上下界(value_low, value_high)。数据通过区域筛选(ParentLocationCode = 'AFR')确保仅包含世卫组织非洲区域(WHO AFRO)国家,且每个国家-年份组合对应单一观测值,未引入性别或年龄等子维度分层。
特点
该数据集的核心特征在于其专注于非洲大陆自然灾害健康影响的量化评估,提供了标准化、机器可读的指标SDGDISASTER。数据来源权威,直接采自WHO官方开放数据,并采用CC BY 4.0许可协议,确保了使用的合法性。数据集包含点估计值及置信区间,便于进行不确定性分析和统计推断。其简洁的表格结构(每行代表一个国家的年度观测值)天然适配于分类与回归任务,便于快速构建预测模型。此外,数据集已剔除子维度分层,呈现为纯净的国家-年份纵向面板数据,支持时间序列分析和跨国家比较研究。
使用方法
该数据集可通过HuggingFace Datasets库轻松加载,调用load_dataset函数即可获取。返回的数据集主要为训练集,可直接转换为Pandas DataFrame进行后续处理。典型用法包括对国家层面数据进行筛选,例如通过过滤dim1字段中的'SEX_BTSX'或空值来获取全性别、全国范围的数据。对于时间序列分析,可按国家代码(country_iso3)筛选特定国家,并按年份排序。数据集还包含WHO区域代码、最新更新时间等元数据,便于数据溯源与版本管理。研究人员可结合其他非洲健康或灾害指标进行多变量分析,或利用其插补缺失值以扩展时空覆盖范围。
背景与挑战
背景概述
该数据集名为“非洲——世界卫生组织全球卫生观测站:自然灾害导致的平均死亡率(每10万人口)”,由世界卫生组织全球卫生观测站创建,并由Electric Sheep Africa团队在HuggingFace上重新打包整理。数据集涵盖2005年至2021年间38个非洲国家的自然灾害死亡率数据,核心指标为SDGDISASTER,旨在为机器学习提供统一、标准化的非洲数据资源。该数据集的发布显著提升了非洲地区灾害健康影响研究的可及性,为公共卫生政策制定、灾害风险评估及可持续发展目标(SDGs)监测提供了关键数据支持,尤其在数据稀缺的非洲大陆具有重要影响力。
当前挑战
数据集面临的核心挑战在于解决非洲地区自然灾害死亡率监测的领域难题,包括数据稀疏性、跨国家/年份的不一致性以及自然灾害定义的区域差异,使得模型泛化与鲁棒性训练困难重重。在构建过程中,挑战主要源于从WHO OData API解析异构数据时的格式统一与缺失值处理,特别是置信区间字段的稀疏性限制了统计推断能力;此外,涵盖38国与17年跨度仅379条记录的小样本规模(n<1K)加剧了过拟合风险,且缺乏粒度更细的次国家层面数据,削弱了模型在区域性风险评估中的实用性。
常用场景
经典使用场景
在公共健康与灾害风险交叉研究领域,该数据集常被用于构建非洲各国因自然灾害导致的年均死亡率回归模型,通过分析2005至2021年间38个非洲国家的面板数据,揭示气候变迁、地理脆弱性与人口暴露度对死亡率的量化影响,为联合国可持续发展目标框架下的灾害韧性评估提供可复现的基准训练语料。
衍生相关工作
基于该数据集衍生出的代表性工作包括:利用广义线性模型与随机森林对比非洲不同次区域灾害死亡率驱动因子的比较研究、融合卫星气候数据的死亡率预测集成学习框架,以及将WHO面板数据嵌入至联合国减灾署全球评估报告的区域韧性指数构建方法,这些成果共同构成了连接公共健康计量与灾害科学的算法化知识谱系。
数据集最近研究
最新研究方向
该数据集聚焦于非洲大陆自然灾害所致人口死亡率的长时序动态监测,为机器学习驱动的灾害脆弱性评估与可持续发展目标(SDG)进展追踪提供了标准化、高质量的数据基础。在全球气候变化加剧极端天气事件的背景下,研究热点正从单一死亡率统计转向与气候模型、社会经济脆弱性指数的交叉分析,借助该数据集可构建预测预警模型,识别高风险区域与人群,为非洲减防灾政策制定及国际救援资源优化配置提供数据支撑。该数据集的开放共享推动了非洲本土健康数据的可计算化进程,助力缩小全球健康数据鸿沟。
以上内容由遇见数据集搜集并总结生成



