five

electricsheepafrica/africa-who-mortality-rate-among-children-ages-5-to-9-years

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-mortality-rate-among-children-ages-5-to-9-years
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含WHO GHO指标“5至9岁儿童死亡率(每1000名5岁儿童)”(WHOSIS_000016)在非洲国家的国家级别观察数据,时间跨度为1990年至2023年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件的形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了47个非洲国家,总行数为4,794行,并提供了按性别等子维度的分类。

This dataset contains country-level observations for the WHO GHO indicator "Mortality rate among children ages 5 to 9 years (per 1000 children aged 5)" (WHOSIS_000016) across African nations, spanning 1990–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 4,794 rows and includes sub-dimensions such as sex.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在全球公共卫生领域,准确衡量儿童健康水平是制定政策与干预措施的关键前提。本数据集聚焦于非洲地区5至9岁儿童死亡率(每千名儿童中的死亡人数),源自世界卫生组织全球卫生观察站(GHO)的OData API,经由Electric Sheep Africa项目重新整合与标准化处理。数据以Parquet格式存储,共计涵盖47个非洲国家、时间跨度从1990年至2023年,总计4794条观测记录。所有数值均直接提取自原始API的浮点型字段NumericValue,而非经过格式化的显示字符串,同时保留了置信区间的上下限字段,以确保数值完备性与分析精确性。此外,数据集按性别等维度进行了分层,呈现出国家、年份与子维度组合而成的多行结构,便于多层次统计建模。
使用方法
利用HuggingFace的datasets库可轻松加载本数据集,一条简单的load_dataset命令即可获得完整的训练集表格,并借助to_pandas()方法转化为DataFrame进行深入分析。为抽取总体水平的数据,建议通过dim1字段筛选以_BTSX结尾或缺失的行,以排除性别或城乡分层带来的偏差。针对单国时间序列分析,则可使用country_iso3字段进行过滤,并按year字段排序。若需聚合不同子维度的观测值,则需结合dim1与dim2进行分组计算。如此,无论研究人员旨在进行死因建模、区域对比,还是构建预测算法,本数据集均能提供清晰且高效的起点。
背景与挑战
背景概述
非洲地区儿童健康问题长期受到国际公共卫生领域的深切关注,尤其是5至9岁年龄段的儿童死亡率,作为衡量初级医疗覆盖、疾病干预成效及社会环境福祉的关键指标,其系统性监测对制定精准政策至关重要。由世界卫生组织全球卫生观察站(WHO GHO)主导发布的该数据集(WHOSIS_000016),经Electric Sheep Africa团队整合重构后于HuggingFace平台发布,覆盖1990至2023年间47个非洲国家的观测数据,旨在为机器学习驱动的流行病学研究提供统一、可复用的结构化资源。其核心价值在于突破以往数据碎片化与格式异构的局限,通过标准化的Parquet文件与详尽元数据,助力研究者深入探讨区域卫生不平等、宏观干预效果评估等重大议题,对推动非洲儿童健康监测体系迈向数据智能时代具有里程碑意义。
当前挑战
该数据集所应对的核心领域挑战在于厘清并量化非洲地区社会经济发展差异、疾病预防服务覆盖不均与儿童死亡率间的复杂非线性关联,传统统计模型常难以捕捉环境脆弱性与医疗基础设施薄弱带来的叠加效应。在构建过程中,团队面临多重技术阻碍:首先,WHO原始API返回的数值字段存在精度取舍与字符串与浮点值的混杂问题,需严格甄别以确保机器学习输入的纯净度;其次,指标按性别、居住地类型等维度分层呈现(如SEX_BTSX),导致47国×34年数据衍生出近5000条记录,处理缺失的置信区间边界值并设计适配聚合与过滤策略成为维持统计推断鲁棒性的关键;此外,确保时序数据中各国报告口径的一致性,并兼容34年间从国家独立到行政体系变更引发的元数据漂移,亦大幅提升了数据清洗的复杂度。
常用场景
经典使用场景
在儿童健康与流行病学研究中,该数据集被广泛用于量化非洲地区5至9岁儿童的全因死亡率,并分析其随时间演变的趋势。研究者常利用其按性别细分的子维度(如男女死亡率对比),构建广义线性模型或生存分析,以评估不同国家在千年发展目标及可持续发展目标框架下的健康干预成效。该数据集提供的置信区间使得不确定性量化成为可能,为区域间差异比较提供了统计依据。
解决学术问题
该数据集有效填补了非洲儿童死亡率研究中的高分辨率数据空白,解决了此前因缺乏连贯、标准化时间序列数据而难以开展跨国比较分析的问题。它使得学者能够系统探究社会经济因素、冲突暴发或卫生政策变化对5-9岁儿童生存率的影响机制,为验证‘儿童生存悖论’等假说提供了实证基础,并推动了全球健康治理中证据驱动的政策评估方法学发展。
实际应用
在实际应用中,该数据集被世界卫生组织成员国及非政府组织用于监测国家免疫计划、疟疾控制项目及初级医疗体系建设对儿童生存率的影响。国际发展机构如联合国儿童基金会依赖此类数据来优化资源分配,优先资助死亡率下降缓慢的非洲国家。此外,保险公司与公共卫生部门也将其作为精算模型输入,评估儿童健康险种的长期赔付风险。
数据集最近研究
最新研究方向
在当前全球公共卫生领域,尤其是在非洲地区,5至9岁儿童死亡率作为衡量初级保健覆盖与疾病防控成效的关键指标,正被广泛应用于脆弱人群健康不平等评估与传染病干预效果的时间序列建模研究。伴随世界卫生组织开放数据倡议的深化,该数据集(WHOSIS_000016)借助标准化Parquet格式与置信区间字段,为机器学习驱动的区域流行病学预测、贫困与营养状况关联分析,以及《2030年可持续发展议程》中儿童生存目标进展监测提供了高精度、可复现的数据基础,有力推动了非洲本土健康数据科学的发展。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务