five

electricsheepafrica/africa-who-under-five-mortality-rate-u5mr

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-under-five-mortality-rate-u5mr
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)关于非洲国家5岁以下儿童死亡率(每1000活产婴儿死亡数)的国家级观测数据,时间跨度为1993年至2019年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据仓库。数据直接从WHO GHO的OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间上下限(value_low, value_high)。数据集覆盖41个非洲国家,总行数为5,399行,并包含多个子维度,如年龄组、性别、居住地区类型等。

This dataset contains country-level observations for the WHO GHO indicator "Under-five mortality rate (deaths per 1000 live births)" (`u5mr`) across African nations, spanning 1993–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 41 African nations with a total of 5,399 rows and includes various sub-dimensions such as age group, sex, residence area type, etc.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦非洲地区五岁以下儿童死亡率(每千例活产死亡数)这一关键公共卫生指标。数据覆盖1993至2019年间41个非洲国家,共计5399条观测记录,所有数值均直接提取自API中的浮点精度字段NumericValue,并同步纳入置信区间上下界。数据以Parquet格式重新封装,形成统一架构的机器学习就绪数据集,隶属于Electric Sheep Africa联合仓储体系。
特点
数据集具备多维分层特性,包含AGEGROUP、EDUCATIONLEVEL、RESIDENCEAREATYPE、SEX、WEALTHDECILE及WEALTHQUINTILE等五个子维度,允许用户依据国家、年份与特定分层维度进行灵活筛选。每行代表国家、年份与维度组合的唯一观测值,借助dim1与dim2字段标识细分群体。此外,数据集完整保留了时间戳、显示字符串及区域编码等元信息,便于追溯数据来源与时效性。
使用方法
用户可通过HuggingFace Datasets库直接加载数据,例如使用load_dataset('electricsheepafrica/africa-who-under-five-mortality-rate-u5mr')命令,并将其转换为Pandas DataFrame进行后续分析。典型应用场景包括筛选两性混合的全国层面数据,或针对特定国家如肯尼亚(ISO代码KEN)提取时间序列。数据集同时支持回归与分类任务,适合用于预测建模、趋势分析及卫生政策评估等研究领域。
背景与挑战
背景概述
非洲五岁以下儿童死亡率(U5MR)是衡量全球儿童健康与生存状况的核心指标,直接关联联合国可持续发展目标(SDG)中关于消除可预防儿童死亡的具体目标。该数据集由世界卫生组织(WHO)下属的全球卫生观察站(GHO)于2019年整理发布,并被Electric Sheep Africa项目重新打包成机器学习友好格式。数据集覆盖1993至2019年间41个非洲国家的5,399条观测记录,聚焦于撒哈拉以南非洲地区,为研究区域健康不平等、评估公共卫生干预效果提供了关键数据基础。其影响力在于填补了非洲大陆高分辨率、长时序健康数据的空白,推动了利用数据科学方法解决发展问题的进程,尤其支持了关于贫困、教育、城乡差异与儿童生存率关联的深入分析。
当前挑战
该数据集的核心挑战在于应对非洲地区儿童死亡率背后的复杂社会结构性因素。领域问题方面,U5MR不仅反映医疗系统质量,更与贫困、营养不良、母亲教育水平及清洁水源可及性等社会经济变量紧密交织,导致建模与归因分析面临高度非线性关系。构建过程中的挑战则体现在数据质量与完整性上:WHO原始数据存在大量分层维度(如性别、城乡、财富五等分),各维度组合产生稀疏矩阵;同时,许多低资源国家的历史观测值缺失严重,置信区间边界标记不一,且部分年份的数据分布呈现显著不均匀。这些特征要求研究者必须采用稳健的缺失值处理策略与降维方法,并从公共卫生视角进行解读,以避免因数据碎片化导致误导性结论。
常用场景
经典使用场景
在非洲公共卫生与儿童健康研究领域,五岁以下儿童死亡率(U5MR)是衡量区域健康水平与社会发展的核心指标。该数据集汇集了1993年至2019年间41个非洲国家的官方统计数据,涵盖性别、年龄组、居住地类型、教育水平及财富分位数等多维分层信息。研究人员常利用其进行时间序列分析与跨国家比较,通过筛选全国层面或特定亚群的数据,构建死亡率趋势模型,评估不同维度下的健康不平等现象,为政策干预提供定量依据。
衍生相关工作
该数据集衍生了一系列具有影响力的学术工作,包括利用多层级模型探讨U5MR与母亲教育水平、家庭财富指数之间的关联性研究,以及基于时空统计方法绘制非洲儿童死亡热力图的开创性成果。研究人员还开发了用于预测未来死亡率轨迹的贝叶斯层次模型,并对比不同机器学习算法在处理缺失值与置信区间时的表现。这些工作不仅深化了对非洲儿童健康决定因素的理解,也为后续数据驱动的健康政策评估与成本效益分析奠定了方法论基础。
数据集最近研究
最新研究方向
在全球公共卫生领域,五岁以下儿童死亡率(U5MR)长期被视为衡量儿童健康水平与医疗卫生体系效能的核心指标。当前研究前沿聚焦于借助该数据集揭示非洲地区U5MR的时空演变规律与不平等分布格局,尤其关注教育水平、居住地类型(城乡)、财富阶层及性别等社会分层维度对儿童生存状况的差异化影响。结合世界卫生组织全球卫生观测站(GHO)的标准化数据,研究者正运用机器学习与时间序列分析模型,探索1993至2019年间41个非洲国家U5MR的驱动因素与区域异质性,为精准干预政策的制定与联合国可持续发展目标(SDG 3.2)的进展评估提供量化支撑。该数据集的发布契合非洲数据科学蓬勃发展的趋势,其高质量、机器可读的结构化设计极大促进了跨国家、跨年代的健康不平等的实证研究,对推动以证据为基础的公共卫生决策具有深远的学术与现实意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作