five

electricsheepafrica/africa-who-severe-wasted-prevalence-among-children-under-5-years-of-age

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-severe-wasted-prevalence-among-children-under-5-years-of-age
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(GHO)指标“5岁以下儿童严重消瘦患病率(%体重-身高<-3 SD),基于调查的估计”(NUTRITION_WH_3)在非洲国家的国家级观察数据,时间跨度为1986年至2024年。数据直接来源于WHO GHO OData API,并以Parquet文件形式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖46个非洲国家,包含多个子维度,如年龄组、教育水平、家庭财富、居住地区类型、性别和财富分布等。

This dataset contains country-level observations for the WHO GHO indicator "Severe wasted prevalence among children under 5 years of age (% weight-for-height <-3 SD), survey-based estimates" (`NUTRITION_WH_3`) across African nations, spanning 1986–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在全球公共卫生领域,儿童营养状况的监测是评估区域健康水平与制定干预策略的重要基石。该数据集基于世界卫生组织全球卫生观察站(WHO GHO)的OData API,系统性地采集了非洲46个国家自1986年至2024年间关于5岁以下儿童严重消瘦患病率(以体重身高比低于-3个标准差为基准)的调查估计值。数据经过规范化处理,以Parquet格式统一封装,保留了浮点精度的核心数值(NumericValue),并同步纳入可用置信区间(value_low与value_high),确保数值准确性与统计分析的可复现性。
特点
该数据集的一大特色在于其丰富且结构化的子维度划分,覆盖了年龄组(AGEGROUP)、教育水平(EDUCATIONLEVEL)、家庭财富指数(HOUSEHOLDWEALTH)、居住地类型(RESIDENCEAREATYPE)、性别(SEX)以及财富十分位和五分位等多重分层变量。每个国家、年份与维度组合均生成独立记录,使得研究者能够精准定位特定亚人群的营养不良态势。此外,数据集收录了WHO AFRO区域内的全部非洲国家,总计超过2.6万条观测,为跨时空的比较分析与机器学习建模提供了高质量、标准化的数据基础。
使用方法
使用者可通过HuggingFace的datasets库便捷加载数据,如`load_dataset("electricsheepafrica/africa-who-severe-wasted-prevalence-among-children-under-5-years-of-age")`,并转换为Pandas DataFrame进行后续分析。支持通过`dim1`与`dim2`字段过滤特定分层(如仅保留两性均值的全国层面数据),亦可利用`country_iso3`与`year`列构建时间序列或跨国比较。核心目标列`value_numeric`可直接用于回归或分类任务,配合置信区间可进一步评估估计的稳健性,适用于流行病学建模、政策评估与营养健康预测等场景。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)于2024年发布,并由Electric Sheep Africa团队重新整理为机器学习就绪格式,聚焦于非洲46个国家1986至2024年间5岁以下儿童严重消瘦患病率(体重-身高比低于-3标准差)的调查估算。该指标是衡量儿童急性营养不良的关键哨点,直接关联联合国可持续发展目标中消除饥饿与改善营养的全球议程。数据集涵盖超过2.6万条观测记录,并细分为年龄组、教育水平、家庭财富、居住地类型、性别等多个维度,为跨国家、跨时期的营养流行病学分析提供了高分辨率数据基础。其开放获取(CC BY 4.0)特性极大降低了非洲健康数据的使用门槛,推动了区域间比较研究和政策评估的量化进程。
当前挑战
该数据集所应对的核心领域挑战在于非洲地区儿童严重营养不良的监测数据稀疏、标准不一,且缺乏统一可分析的机器可读格式。传统的调查数据常以分散、非结构化的形式存在于各国报告中,难以进行跨时空的建模与趋势推断。在构建过程中,主要挑战包括:从WHO OData API中抽取并规范化来自46个国家的异构时间序列数据,确保各字段如置信区间与分层维度的完整性;处理因调查方法、样本覆盖范围不同导致的指标可比性问题;以及将分为多个亚组(如性别、财富五等分法)的观测整合为一致性强的表格,同时保留分层与聚合的灵活性,以支持不同粒度的机器学习任务与统计推断。
常用场景
经典使用场景
该数据集聚焦于非洲五岁以下儿童严重消瘦患病率的调查估计值,以体重身高比低于-3个标准差为核心指标。在公共卫生与营养学领域,研究者常将其用于构建时空预测模型,借助长达近四十年的跨国家面板数据,分析非洲大陆儿童营养不良的演变趋势。数据集中丰富的亚组维度,如年龄分层、性别、居住地类型、教育水平和财富五等分,使得研究者能够深入剖析社会经济与地理环境对儿童营养状况的异质性影响,为精准干预提供循证依据。
实际应用
在实际应用中,该数据集为国际组织与非洲各国卫生部门提供了关键决策支持。它可以协助世界卫生组织、联合国儿童基金会等机构监测可持续发展目标中关于消除饥饿与改善营养的进展。各国政府与非政府组织可借助数据中的时间序列与地理分布,识别营养危机热点区域,优化食品援助与医疗资源的配置。此外,该数据集也常用于训练机器学习模型,用以预测未来营养不良风险,助力预警系统的建设。
衍生相关工作
该数据集衍生了一系列具有影响力的研究工作。基于这一标准化的非洲健康数据,研究者已开发出多国别营养状况的时空插值模型,并生成高分辨率的营养不良风险地图。部分工作利用其分层结构构建了社会不公平性分析框架,揭示了财富与教育水平对儿童健康的梯度效应。另有学者将其与其他气候、粮食安全数据集融合,开展非线性因果推断,探讨气候变化与幼儿营养危机的复杂关联,为全球健康治理提供了新的分析范式。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务