five

electricsheepafrica/africa-who-wasting-prevalence-among-children-under-5-years-of-age

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-wasting-prevalence-among-children-under-5-years-of-age
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“5岁以下儿童消瘦患病率(%体重-身高<-2 SD),基于调查的估计”(NUTRITION_WH_2)在非洲国家的国家级观察数据,时间跨度为1985年至2024年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来自世界卫生组织全球健康观察OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Wasting prevalence among children under 5 years of age (% weight-for-height <-2 SD), survey-based estimates" (`NUTRITION_WH_2`) across African nations, spanning 1985–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,整合了1985至2024年间47个非洲国家的儿童消瘦患病率调查估算数据。通过规范的提取与清洗流程,原始数据中的`NumericValue`字段被保留为浮点精度核心值,同时附带置信区间上下限。数据集以统一的Parquet格式封装,每一条记录均对应国家、年份及其细化维度的唯一组合,从而形成具有结构化特征的表格数据,为机器学习任务提供了可直接使用的标准化输入。
特点
该数据集最显著的特征在于其多维度分层结构,涵盖了年龄组、教育水平、家庭财富、居住地类型、性别、财富十分位数与五分位数等十余种亚类变量。当某项指标存在分层统计时,每个国家-年份-维度的组合均独立成行,研究者可通过`dim1`与`dim2`字段灵活筛选目标亚群。此外,数据集中包含了点估计值及其上下置信区间,极大便利了不确定性分析与统计推断,体现了其在公共卫生建模中的实用价值。
使用方法
使用该数据集时,可通过HuggingFace的`datasets`库直接加载,并以Pandas DataFrame格式进行操作。用户既可基于`dim1`字段挑选整体层面的观测(如性别总合`SEX_BTSX`),亦可按国家代码进行时序切片,如筛选肯尼亚的所有记录并排序年份以观察趋势变化。为获得全国性估算,建议过滤掉所有分层维度,仅保留总合值,从而确保分析结果反映宏观水平而非局部特征。
背景与挑战
背景概述
该数据集由世界卫生组织全球卫生观测站(WHO GHO)创建,并由Electric Sheep Africa团队整理封装,聚焦于非洲地区5岁以下儿童消瘦患病率(以体重-身高比低于-2个标准差为衡量标准)的调查估计值。核心研究问题在于精准量化1985至2024年间非洲47个国家儿童营养不良的时空分布特征,为公共卫生政策制定提供数据驱动的基础。作为全球健康数据的重要补充,该数据集填补了非洲大陆在儿童营养指标上长期缺乏统一、机器可读格式数据的空白,对实现联合国可持续发展目标中消除饥饿与营养不良的监测评估具有显著影响力。
当前挑战
数据集面临的核心领域挑战在于:消瘦患病率作为敏感健康指标,受社会经济、地理环境与调研方法差异影响,其估计值具有高度异质性,需应对数据稀疏性与区域间可比性不足的统计难题。构建过程中遭遇的挑战包括:从WHO OData API整合来自多来源调查的异构数据时,需处理缺失值、置信区间不完整及分层维度(如年龄组、财富五分位、居住地类型)导致的复杂数据聚合;同时,确保时间序列数据在47个国家间的一致性,并转化为适用于机器学习的标准化Parquet格式,对数据清洗与架构设计提出了严苛要求。
常用场景
经典使用场景
该数据集汇聚了非洲47个国家1985年至2024年间五岁以下儿童消瘦患病率的调查估算数据,以世界卫生组织全球卫生观察站的标准化指标为核心,记录了体重指数低于正常值两个标准差的人口比例。研究者可借助这一纵向面板数据进行跨国家、跨年代的消瘦负担比较分析,亦可按年龄组、性别、居住地类型、教育水平及财富分层等亚维度进行细粒度剖析,是评估非洲儿童营养不良演变趋势和区域差异的经典资源。
衍生相关工作
基于该数据集,衍生出一系列关于非洲儿童营养不良驱动因素的计量经济学研究与机器学习预测工作,例如通过随机森林或广义线性模型解析气候变迁、粮食安全与消瘦患病率之间的关联机制。此外,研究者还将其与卫生设施覆盖率、疫苗接种率等关联数据集进行跨领域融合,构建复合健康指数,推动从单一营养监测迈向全维度儿童健康风险预警系统的开发。
数据集最近研究
最新研究方向
该数据集聚焦于非洲五岁以下儿童消瘦患病率的时空演变与多维不平等性分析,其前沿研究方向已悄然转向结合机器学习与全球健康治理的交叉领域。依托WHO全球卫生观察站近四十年的调查估计,研究者正利用这一高粒度指标——覆盖47个国家、多重年龄分层及财富五分位等亚维度——来精准刻画营养不良的地缘异质性。在可持续发展目标(SDG 2)与非洲大陆粮食安全危机的双重驱动下,该数据成为评估人道主义干预效果、预警气候冲击下营养恶化的关键工具。特别是通过置信区间与人口学协变量的嵌套,模型能够揭示财富底端40%家庭中消瘦率的隐蔽攀升趋势,为制定靶向营养补充计划提供证据锚点。当前热点更聚焦于整合卫星遥感与气象数据,构建从环境驱动因子到营养结果的可解释预测框架,推动全球健康领域从描述性流行病学向因果推断范式的跃迁。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务