electricsheepafrica/africa-who-age-standardized-death-rates-0000001442
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-age-standardized-death-rates-0000001442
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2002-2004年间,世界卫生组织全球健康观察站(WHO GHO)指标年龄标准化死亡率,跌倒,每100,000人(SA_0000001442)的国家级观察数据。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。
This dataset contains country-level observations for the WHO GHO indicator Age-standardized death rates, falls, per 100,000 (SA_0000001442) across African nations, spanning 2002–2004. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区因跌倒导致的年龄标准化死亡率(每10万人)。原始数据经过精心提取与重构,采用Parquet格式存储,并遵循统一的模式规范。所有数值均直接采用浮点精度的`NumericValue`字段,而非展示字符串,同时保留了置信区间边界(`value_low`、`value_high`)。数据集覆盖了2002年至2004年间46个非洲国家(限定于WHO AFRO区域)的184条观测记录,是Electric Sheep Africa系列中一个面向机器学习的标准化非洲数据资源。
使用方法
数据集的加载与使用极为便捷。研究者可通过HuggingFace的`datasets`库一键加载,并轻松转换为Pandas DataFrame进行后续分析。推荐的操作包括:利用`dim1`字段筛选出仅包含“男女”混合的全国级别数据,或针对特定国家(如肯尼亚)按年份排序以观察死亡率的时间趋势。该数据集可直接作为机器学习模型的特征输入(以`value_numeric`为目标变量),也可结合置信区间进行稳健性检验,适用于非洲公共卫生领域的量化研究。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2024年整理发布,源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据,聚焦非洲大陆46个国家在2002至2004年间因跌倒导致的年龄标准化死亡率(每10万人)。作为非洲ML-ready数据集系列的一部分,其核心研究问题在于量化非洲地区跌倒这一意外伤害的公共卫生负担,为区域健康不平等分析、疾病负担建模及政策制定提供标准化的、可直接用于机器学习的基础数据。该数据集以其高度结构化、覆盖广泛且元数据完备的特性,弥补了非洲健康领域高质量、易获取数据集的稀缺性,对推动非洲公共卫生数据驱动研究具有里程碑意义。
当前挑战
该数据集面对的领域挑战在于,跌倒死亡率在非洲常被低估且缺乏系统监测,数据稀疏性与质量参差不齐使得跨国家、跨时期的可比性分析十分困难。构建过程中,挑战源于从WHO OData API提取原始数据后需处理多维分层(如性别、城乡)、缺失的置信区间以及不一致的字符串表达,并需甄别‘NumericValue’与显示字段的差异,同时确保最终数据集格式统一、无冗余且可直接用于机器学习流水线,这要求精细的数据清洗、逻辑检验与元数据对齐工作。
常用场景
经典使用场景
该数据集最经典的使用场景在于构建非洲地区跌倒导致的年龄标准化死亡率的预测模型。由于数据以国家为观测单元,覆盖2002至2004年间46个非洲国家的死亡数据,研究者可基于此开展回归或分类任务,探索特定年份、国家或性别维度下死亡率的变化趋势。数据中提供的置信区间也为不确定性量化提供了宝贵资源,特别适合用于训练具有可靠性评估能力的机器学习系统。
解决学术问题
该数据集为解决非洲区域跌倒相关死亡的流行病学监测与比较问题提供了标准化基础。在学术研究中,它填补了非洲大陆多国、多年龄标准化死亡率数据的稀缺空白,使研究者能够跨越国别差异进行横向比较,揭示非洲在跌倒损伤防控方面的地区性差异。其精细化分层(如性别)支持深入分析社会人口因素对跌倒死亡风险的影响,增强了公共卫生研究证据的可靠性。
实际应用
在实际应用层面,该数据集可支持非洲各国卫生部门开展跌倒相关死亡负担的定量评估,为制定针对性的预防策略提供数据支撑。例如,其国家-年份-性别三维结构使政策制定者能够识别高死亡率群体,优化资源配置。此外,该数据也能整合进全球健康监测仪表盘,辅助WHO等国际组织追踪非洲地区非传染性疾病死亡趋势的变化。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区因跌倒导致的年龄标准化死亡率(每10万人),为全球公共卫生领域揭示了非传染性疾病意外伤害负担的严峻前沿。随着世界卫生组织非洲区域(AFRO)对伤害预防与老年健康的关注升温,这一细粒度指标(含性别与置信区间分层)正推动研究者利用2002-2004年46个国家的横断面数据,构建预测模型以评估脆弱人群风险,并关联气候变化、城市化等热点事件下基础设施不足的致命后果。其通过标准化格式与HuggingFace平台的开放共享,不仅填补了非洲伤害流行病学ML就绪数据的空白,更赋能政策制定者基于证据优化跌倒干预策略,对落实联合国可持续发展目标中减少过早死亡率具有深远意义。
以上内容由遇见数据集搜集并总结生成



