five

electricsheepafrica/africa-who-number-of-deaths-in-children-aged-5-years

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-deaths-in-children-aged-5-years
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“5岁以下儿童死亡人数,按原因分类”(MORT_100)在非洲国家的国家级观察数据,时间跨度为2000年至2021年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Number of deaths in children aged <5 years, by cause" (MORT_100) across African nations, spanning 2000–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区五岁以下儿童因特定原因死亡的统计指标(MORT_100)。原始数据经过系统化抽取与整合,以Parquet格式存储,确保了数据的高效读取与一致性。所有数值均采用浮点精度的NumericValue字段,而非显示字符串,并附有置信区间信息以增强统计可靠性。数据覆盖2000至2021年间47个非洲国家的44,462条观测记录,并依据WHO AFRO区域代码进行筛选,构建了一个面向机器学习应用的标准化数据集。
使用方法
数据集的使用极为便捷,支持通过HuggingFace的datasets库直接加载。用户可调用load_dataset函数获取数据并转换为Pandas DataFrame,便于后续处理。针对不同的研究需求,可通过过滤dim1字段选择特定性别层次(如两性综合数据SEX_BTSX),或依据country_iso3字段提取单一国家的时间序列。数据已预置统一的列结构,适用于分类与回归任务,亦可通过聚合不同维度实现跨层级的统计分析,极大地降低了数据预处理门槛。
背景与挑战
背景概述
该数据集由世界卫生组织全球卫生观察站(WHO GHO)于2021年发布,经Electric Sheep Africa团队整理并托管于HuggingFace平台,聚焦非洲47个国家2000至2021年间5岁以下儿童按死因分类的死亡人数。作为非洲健康数据统一机器学习仓储库的一部分,该数据集旨在解决非洲地区儿童死亡率数据碎片化、可获取性低的问题,推动基于证据的公共卫生决策与流行病学研究。通过整合WHO官方指标MORT_100的标准化观测值,其不仅为模型训练提供可靠基础,更助力国际社会追踪可持续发展目标中降低儿童死亡率的进展,对全球健康不平等议题产生深远影响。
当前挑战
所解决的领域挑战在于非洲儿童死亡原因数据长期存在国家间口径不一、时间序列中断及置信区间缺失等问题,传统统计分析难以捕捉动态趋势,而该数据集通过统一架构和包含上下置信界的信息,为机器学习模型预测死亡率变化提供了结构化输入。构建过程中面临的挑战包括从WHO OData API精准提取数值型而非显示字符串的数据,确保跨47国、多维度(性别、城乡)的分层兼容性,并维护44,462条记录在长时序内的完整性,同时遵循CC BY 4.0许可规范以保障开放复用的合法性。
常用场景
经典使用场景
非洲五岁以下儿童死因数据集整合了世界卫生组织全球卫生观察站(WHO GHO)的官方统计记录,涵盖2000至2021年间47个非洲国家的死亡人数按病因分类信息。该数据集最经典的应用场景是作为监督学习任务的训练基石,研究者可基于其结构化特征构建回归模型以预测儿童死亡率,或采用分类算法识别不同死因的分布模式。数据集中的数值字段如点估计值及置信区间,为量化模型预测的不确定性提供了天然基准,而跨年份的时间序列维度则使得纵向趋势分析成为可能,从而支持更精细的公共卫生建模。
解决学术问题
该数据集直击非洲儿童死亡率居高不下的研究痛点,为探究五岁以下儿童死因的时空异质性提供了标准化数据基础。它解决了长期以来非洲地区健康统计数据碎片化、不统一的学术难题,使研究者能够定量分析死因构成比的演变规律,并评估疟疾、肺炎、腹泻等特定病因对儿童生存的威胁权重。通过大规模观测数据,学者得以验证感染性疾病防控政策与儿童存活率之间的因果关联,进而为全球儿童健康目标(如联合国可持续发展目标3.2)的推进提供实证支撑。
实际应用
在实际应用中,该数据集成为非洲国家卫生部及国际非政府组织制定干预策略的关键情报源。公共卫生决策者可根据死因排序图谱精准调配医疗资源,例如针对腹泻高发地区优先部署口服补液盐和洁净水源设施,或在疟疾致死率突出的区域加强蚊帐分发与青蒿素联合疗法普及。流行病学监测机构还可借助数据中的置信区间字段构建早期预警系统,当某地区儿童死亡数突破历史波动阈值时及时启动应急响应,从而实现从被动应对到主动防御的治理范式转型。
数据集最近研究
最新研究方向
在非洲儿童健康研究的版图中,该数据集聚焦于五岁以下儿童死因的量化分析,为揭示区域卫生不平等、评估干预措施成效提供了宝贵的时间序列证据。当前前沿研究方向已从单纯的死亡率统计转向多维度归因模型构建,结合社会经济与环境协变量,利用机器学习方法精准识别高死亡率的空间异质性与时间动态模式。该数据集与全球儿童生存目标、可持续发展议程中降低可预防死亡的承诺紧密相连,其标准化、机器可读的格式打破了数据壁垒,推动了跨国的因果推断和预测建模研究,对于资源匮乏地区制定精准卫生政策具有里程碑式的意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务