electricsheepafrica/africa-who-number-of-deaths-among-children-ages-10-to-14-years
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-number-of-deaths-among-children-ages-10-to-14-years
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家世界卫生组织全球健康观察指标“10至14岁儿童死亡数量”(CHILDMORT_DEATHS_10TO14)的国家级观测数据,时间跨度为1990年至2021年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Number of deaths among children ages 10 to 14 years" (CHILDMORT_DEATHS_10TO14) across African nations, spanning 1990–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,经Electric Sheep Africa项目重组而成。数据集聚焦于非洲地区10至14岁儿童死亡人数的国家层面观测值,时间跨度涵盖1990年至2021年。所有数据均以Parquet格式存储,并遵循一致的字段架构,数值字段直接采用高精度的浮点型原始值(NumericValue),而非格式化后的显示字符串。同时,当指标存在分层维度(如性别)时,数据集会将每个国家、年份与维度的组合分别记录为独立行,并保留置信区间上下界(value_low、value_high),便于后续的统计推断与分析。
使用方法
该数据集可直接通过HuggingFace Datasets库加载,使用`load_dataset`函数即可将数据读取为Pandas DataFrame,便捷地融入机器学习流水线。用户可按需过滤子维度,例如通过筛选dim1列中结尾为`_BTSX`的行获取不分性别的全国数据,或按国家代码(如`KEN`)提取特定国家的时间序列。对于回归任务,value_numeric列适合作为目标变量;而分类任务则可借助年份、国家等特征构建预测模型。数据集的规整式样与丰富的元数据极大地降低了预处理开销,适合用于卫生健康领域的时空建模与分析。
背景与挑战
背景概述
在全球公共卫生体系中,儿童死亡率是衡量社会福祉与医疗体系效能的核心指标。然而,针对非洲地区10至14岁年龄段的死亡数据长期缺乏系统化整合,制约了区域健康政策的精准制定。由世界卫生组织(WHO)于1990年至2021年间收集、并经Electric Sheep Africa机构重新封装整理的该数据集,专门聚焦于非洲47个国家的儿童死亡统计,目标是为机器学习模型提供结构化、可复用的训练资源。其核心研究问题在于通过统一的数据模式填补区域健康数据的碎片化鸿沟,支持死亡率趋势分析、性别与地域亚群差异研究,从而助力联合国可持续发展目标中的儿童健康议题。该数据集以CC BY 4.0许可开放,已在HuggingFace平台发布,对促进非洲健康数据科学的发展具有重要影响。
当前挑战
该数据集面临多维度挑战。在领域问题层面,儿童死亡率受贫困、疾病爆发、医疗覆盖不均及数据报告滞后等复杂因素影响,模型需处理稀疏性与不平衡分布,同时区分死亡原因(如传染病与意外伤害)的交互作用,这对预测任务的鲁棒性提出严苛要求。在构建过程中,原始数据来源于WHO全球卫生观察站的多维表格,不同年份与国家的记录在指标粒度(如性别分层、置信区间字段)、缺失值(如低分辨率地区的未报告值)以及时间跨度不完整等方面存在显著异质性。此外,从OData API抽取的浮点型数值需与显示字符串严格对齐,避免精度偏差,且跨47国法律与隐私框架下的数据标准化流程增加了清洗复杂度。
常用场景
经典使用场景
该数据集聚焦于非洲地区10至14岁儿童死亡人数这一关键健康指标,覆盖1990至2021年间47个非洲国家的面板数据。在经典的学术研究中,它常被用于构建时间序列模型和回归分析,以揭示儿童死亡率的长期演变趋势与区域差异。研究者可借助该数据集对比不同性别、城乡维度下的死亡负担,为流行病学调查和卫生政策评估提供量化基础。
解决学术问题
该数据集有效解决了非洲儿童健康领域长期存在的数据碎片化与可比性不足的难题。通过整合世界卫生组织全球健康观察站(WHO GHO)的标准化指标,它为研究者提供了统一口径的多年跨国产出,从而能够深入剖析儿童死亡率的变动机理、 socioeconomic 影响因素及干预措施的效果评估。其意义在于填补了非洲区域高分辨率儿童健康数据的空白,为循证决策和全球卫生目标的动态监测提供了坚实支撑。
实际应用
在实际应用场景中,该数据集助力公共卫生机构与政府组织进行儿童健康项目的精准规划和资源分配。基于不同国家、年份及性别的死亡人数统计,决策者可以识别高风险地区,评估现有免疫计划、营养干预和传染病防控措施的有效性。此外,机器学习从业者利用其表格结构开发预测模型,预警未来死亡率波动,从而优化应急响应策略并推动非洲大陆健康公平性的持续改善。
数据集最近研究
最新研究方向
在全球健康的宏大叙事中,儿童死亡率始终是衡量社会福祉与卫生体系效能的核心标尺。该数据集聚焦非洲大陆10至14岁年龄段的死亡人数,覆盖47个国家长达三十余年的纵向观测,为探究青少年非传染性疾病负担、伤害流行病学及区域卫生不平等提供了弥足珍贵的量化基石。当前,该领域的前沿研究正借力此类细粒度数据,深度融合机器学习的预测与归因能力,旨在揭示贫困、营养不良、冲突与气候变化交织下青少年死亡风险的多维驱动因子。例如,通过时间序列分析与因果推断框架,研究者得以识别特定干预措施(如疫苗接种覆盖率提升、安全饮用水普及)的真实效果,进而为世界卫生组织及各国卫生部门制定精准的公共卫生策略提供数据驱动的洞见。这一数据集的标准化与开放获取,不仅催化了非洲健康大数据生态的构建,更推动了全球范围内关于青少年生存权益与可持续发展目标进展的实证讨论,其影响力已延伸至全球卫生治理、跨国政策评估及人道主义响应等关键领域。
以上内容由遇见数据集搜集并总结生成



