five

electricsheepafrica/africa-who-mortality-rate-attributed-to-unintentional-poisoning

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-mortality-rate-attributed-to-unintentional-poisoning
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000年至2021年间,由世界卫生组织全球健康观察站(WHO GHO)提供的因意外中毒导致的死亡率(每10万人)指标数据。数据直接来源于WHO GHO的OData API,并被重新打包为Parquet文件格式,包含数值字段和置信区间等信息。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据仓库。

This dataset contains country-level observations for the WHO GHO indicator "Mortality rate attributed to unintentional poisoning (per 100 000 population)" (`SDGPOISON`) across African nations, spanning 2000–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦非洲地区因意外中毒导致的死亡率(每10万人口),覆盖2000至2021年间47个非洲国家的观测数据。原始数据经Electric Sheep Africa团队系统化整理,以Parquet文件格式重新封装,保留一致的列模式。所有数值均取自英文标示为'NumericValue'的浮点精度字段,并收录了置信区间上下界(如提供),确保数据可用于精确的统计分析。
特点
数据集包含3102条记录,涵盖47个非洲国家及其WHO AFRO区域代码,观测时间跨度长达22年。除了核心的死亡率点估计值外,还提供了性别(SEX)等分层维度(如SEX_BTSX、SEX_FMLE、SEX_MLE),允许用户按不同子群体进行筛选或聚合分析。该数据集设计为机器学习就绪(ML-ready),结构规整,字段包括国家ISO代码、年份、数值及置信区间,便于直接用于表格分类或回归任务。
使用方法
用户可通过HuggingFace的datasets库加载数据集,执行'load_dataset("electricsheepafrica/africa-who-mortality-rate-attributed-to-unintentional-poisoning")',并转换为Pandas DataFrame进行后续操作。典型应用包括过滤出仅代表两性总和(dim1为SEX_BTSX或缺失值)的国家层面数据,或提取特定国家(如肯尼亚)的时间序列以分析趋势。数据分层维度灵活,支持按dim1/dim2字段精确筛选所需子群,适用于流行病学建模、可持续发展目标(SDG)进展监测等场景。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2023年前后整理发布,源自世界卫生组织全球卫生观察站(WHO GHO)的公开数据,聚焦于非洲地区因非故意中毒所致的死亡率(每10万人)。作为联合国可持续发展目标(SDG)中健康指标的关键组成部分,该数据涵盖2000年至2021年间47个非洲国家的3102条观测记录,旨在为机器学习驱动的健康监测与预测模型提供标准化的训练素材。其发布填补了非洲大陆在公共卫生领域高质量、结构化数据集的空白,促进了对区域中毒性死亡模式的研究,并为政策制定者评估干预效果提供了量化依据,对推动非洲健康数据的开放性与可重复性研究具有重要影响。
当前挑战
该数据集首要挑战是解决非洲地区因数据稀疏性与统计能力不足导致的非故意中毒死亡率监测难题——许多国家长期缺乏完整登记系统,导致年份间的缺失值显著,限制了时间序列分析与因果推断的可靠性。其次,数据构建过程中面临多重困难:原始WHO数据以非结构化或异构格式存在,需统一解析为一致的Parquet模式;不同国家间诊断标准与编码规范存在差异,影响横截面可比性;此外,性别与居住地类型等亚维度分层信息的不一致性增加了特征工程与多变量建模的复杂性,要求研究者谨慎处理数据清洗与填补策略,以避免引入偏差。
常用场景
经典使用场景
在非洲公共卫生与流行病学研究中,该数据集作为分析非故意中毒死亡率时空动态的核心资源,广泛应用于描述不同性别、国家及年份间的毒性暴露负担差异。研究者常借助其分层维度(如性别、城乡)解析脆弱人群的分布特征,或结合社会经济指标量化中毒死亡与医疗可及性、环境监管之间的关联。其结构化时序数据支持面板回归、生存分析等经典统计建模,为评估区域干预措施的有效性提供实证基础。
解决学术问题
该数据集直面非洲大陆非故意中毒死亡率长期被忽视的学术困境,填补了WHO框架下该指标高精度、多国别、长跨度标准化数据的空白。它使学者能够系统量化中毒对过早死亡的贡献率,并揭示性别不平等、卫生系统薄弱等结构性因素在中毒致死中的作用机制。借助置信区间字段提升估计可靠性,推动国际比较研究从描述性转向因果推断,为全球可持续发展目标(SDG 3.9)的监测提供非洲区域的科学证据。
衍生相关工作
该数据集催生了多项衍生性学术工作,包括构建非洲中毒死亡率预测的时序机器学习模型(如梯度提升、LSTM),评估经济变迁与中毒风险的动态因果关系。有研究将其与WHO其他指标(如医疗设施密度、酒精消费)融合,搭建多暴露因素交互分析框架。此外,数据清洗与信息增益分析促使Electric Sheep Africa团队发布了标准化非洲健康数据管线,后续学者利用该数据集验证了人口迁移对中毒死亡率的调节效应,并开发了交互式可视化仪表盘,支持实时追踪SDG指标的进展态势。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务