electricsheepafrica/africa-who-mortality-rate-for-5-14-year-olds
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-mortality-rate-for-5-14-year-olds
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家5-14岁儿童死亡率(每1000名5-14岁儿童的死亡概率)的国别观察数据,时间跨度为1990年至2023年。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自`NumericValue`字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`, `value_high`)。该数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。
This dataset contains country-level observations for the WHO GHO indicator "Mortality rate for 5-14 year-olds (probability of dying per 1000 children aged 5-14 years)" (`CHILDMORT5TO14`) across African nations, spanning 1990–2023. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站的OData API,聚焦非洲地区5至14岁儿童死亡率指标(CHILDMORT5TO14)。原始数据经过系统化重新打包处理,转换为Parquet格式以适配机器学习工作流。数据涵盖了1990年至2023年间47个非洲国家的观测记录,共计4794行。所有数值均采用浮点精度的NumericValue字段,而非显示字符串,并附带了置信区间的上下界(value_low与value_high),以确保分析精度。数据集亦按性别等维度进行了分层(如SEX_BTSX、SEX_FMLE、SEX_MLE),为多维度建模提供了详实基础。
特点
该数据集的核心特色在于其结构一致、面向机器学习的标准化设计。每条记录包含指示符代码、国家ISO代码、WHO区域、年份、数值估计、置信区间、显示字符串及层次化维度标签(dim1和dim2)。其覆盖范围广泛,囊括了WHO非洲区域内的全部47个国家,保证了区域代表性。此外,数据集提供了整数年份字段以便于时间序列分析,且元数据中标注了最新更新时间,确保了数据时效性。作为Electric Sheep Africa统一数据集的一部分,该数据集为跨国家、跨时段的儿童死亡率研究提供了简洁、可直接调用的数据源。
使用方法
用户可通过HuggingFace的datasets库便捷加载该数据集,使用load_dataset('electricsheepafrica/africa-who-mortality-rate-for-5-14-year-olds')直接获取训练数据。加载后可利用to_pandas()方法转换为Pandas DataFrame进行后续分析。针对特定研究需求,可通过筛选dim1字段中的'_BTSX'结尾值或空值来获取全国层面的两性合并数据。若需分析单个国家的时间趋势,则可按country_iso3列过滤并依年份排序,例如针对肯尼亚(KEN)的分析。该数据集兼容分类与回归任务,并提供了置信区间字段以供不确定性建模。
背景与挑战
背景概述
在全球公共卫生领域,儿童死亡率是衡量一个地区健康水平与可持续发展进程的核心指标之一。由世界卫生组织全球卫生观察站创建的非洲5-14岁儿童死亡率数据集(africa-who-mortality-rate-for-5-14-year-olds),经Electric Sheep Africa团队重新整理并发布于HuggingFace平台,覆盖1990至2023年间47个非洲国家的观测数据。该数据集聚焦于5至14岁儿童每千人中死亡概率的精确估计,并提供了按性别等维度划分的子指标,为研究非洲儿童生存状况、评估卫生干预效果及指导政策制定提供了关键的定量基础。其开放获取许可与机器学习就绪格式,显著降低了非洲区域健康数据分析的壁垒,有力推动了数据驱动的发展研究与实践。
当前挑战
该数据集所面临的挑战首先源于其所解决的领域问题:非洲地区5-14岁儿童死亡率的精确估计长期受限于数据稀疏性、报告时滞以及国家间登记系统的不完善,导致传统模型难以捕捉真实的时空异质性与亚群差异。在构建过程中,挑战尤为突出:从WHO OData API提取原始数据时需处理不同维度的分层结构(如性别、居住地类型),并协调一致性;缺失置信区间值的处理、多语言显示字符串到数值的规范化转换,以及多国多年跨度下数据格式的异构性,均对数据清洗与集成提出了高要求。此外,确保47国数据在时间序列上的完整性与可比性,以及维持与官方来源的可追溯性,也是构建过程中的关键难点。
常用场景
经典使用场景
在公共健康与流行病学研究中,该数据集作为追踪非洲地区5至14岁儿童死亡率的核心数据源,被广泛应用于跨国别、跨时间维度的儿童生存状况评估。研究者可借助该数据集中的点估计值、置信区间及性别分层维度,深入剖析不同非洲国家在1990至2023年间儿童死亡率的时空演变趋势,为国际卫生政策制定提供量化依据。
实际应用
在实际应用层面,该数据集为世界卫生组织及非洲各国卫生部门的儿童健康干预项目提供了关键输入。决策者可通过实时监测死亡率波动,评估疫苗接种计划、疟疾防控及营养改善等公共卫生措施的实际成效。此外,机器学习从业者可将该数据作为回归与分类任务的训练基准,开发预测模型以早期预警高风险区域,指导医疗资源精准投放。
衍生相关工作
围绕该数据集,已衍生出一系列关注非洲儿童健康的社会经济影响研究,例如将死亡率数据与气候、教育投入、人均GDP等变量联结,构建多因驱动模型。同时,基于该数据的时空预测基准任务催生了若干对比传统统计方法与深度学习算法的实证工作,特别是利用LSTM和贝叶斯层次模型进行未来五年死亡率区间估计,拓展了人口健康预测的方法论边界。
以上内容由遇见数据集搜集并总结生成



