electricsheepafrica/africa-who-wasting-prevalence-in-children-aged-5-years
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-wasting-prevalence-in-children-aged-5-years
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家5岁以下儿童消瘦患病率(%)的WHO GHO指标(wast5)的国家级观察数据,时间跨度为1993年至2019年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了41个非洲国家,总行数为2,463行,并提供了多个子维度,如年龄组、教育水平、居住地区类型、性别和财富五分位数等。
This dataset contains country-level observations for the WHO GHO indicator Wasting prevalence in children aged < 5 years (%) (`wast5`) across African nations, spanning 1993–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 41 African nations with a total of 2,463 rows and includes multiple sub-dimensions such as age group, education level, residence area type, sex, and wealth quintile.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的官方OData API,聚焦于非洲地区五岁以下儿童消瘦患病率(指标代码wast5)这一关键公共卫生指标。原始数据经由Electric Sheep Africa团队系统化处理,统一转换为Parquet格式,并采用一致的列式存储结构。数据集仅保留NumericValue字段作为精确浮点数值,同时整合了置信区间上下限(value_low、value_high),确保机器学习任务的直接可用性。数据覆盖1993年至2019年间41个非洲国家的2463条观测记录,每条记录均对应国家、年份及可能的分层维度组合(如性别、年龄组、居住地类型等),从而构建出一个结构化、高密度的非洲儿童营养状况时序面板数据。
特点
该数据集的核心特色在于其多维分层结构,允许研究者深入剖析消瘦患病率的亚组差异。除了国家级别的点估计值,数据还按年龄组(0-1岁与2-5岁)、教育水平、居住地类型(城市/农村)、性别及财富五分位数进行细分,为探索社会经济与地理因素对儿童营养的影响提供丰富粒度。此外,数据包含来自人口与健康调查(DHS)的地理区域编码,可衔接更细致的子国家层面分析。所有观测均附带置信区间,便于进行统计推断。作为Electric Sheep Africa统一数据集合的一部分,本数据集遵循CC BY 4.0许可协议,具备高互操作性与可复现性。
使用方法
研究人员可通过HuggingFace Datasets库便捷加载本数据,单行Python代码即可将Parquet文件转化为Pandas DataFrame进行后续分析。典型的使用流程包括:利用dim1字段过滤出国家级整体估计(如性别标记为_BTSX的条目),或按country_iso3与year构建特定国家的时间序列。数据既可直接用于回归任务预测消瘦率,也可结合分层属性进行多类别分类或亚组比较。对于学术应用,建议引用原始WHO GHO数据源及Electric Sheep Africa的再打包版本。数据集不含缺失值处理或特征缩放等预处理步骤,赋予用户根据具体建模需求灵活调整的自由度。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2023年前后整理发布,源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,聚焦非洲41个国家5岁以下儿童消瘦患病率这一关键营养健康指标。核心研究问题在于揭示非洲地区儿童营养不良的地域分布、时间演变及社会分层特征,为公共卫生政策制定与机器学习模型训练提供结构化、高质量的数据基础。作为非洲健康数据统一化、机器学习就绪化的重要组成部分,该数据集已涵盖1993至2019年间共计2463条观测,按国家、年份、性别、居住地类型、教育水平及财富五分位等多维度进行分层,显著提升了相关流行病学分析和预测研究的可复现性与跨学科应用潜力,对推动非洲儿童营养健康领域的量化研究具有重要影响力。
当前挑战
该领域面临的核心挑战在于准确评估非洲儿童消瘦患病率的复杂时空动态,尤其是在数据稀疏、调查周期不一致及亚群体差异显著的背景下。构建过程中,主要挑战包括:从WHO GHO API获取的原始数据存在维度不统一、置信区间缺失、显示字符串与数值字段不一致等问题,需进行严格清洗和标准化;41个国家的观测年份跨度达26年,部分国家数据覆盖不连续,需处理缺失值与时间序列插补;此外,需将多级分层维度(如DHS地理区域编码)统一为机器学习友好的列式结构,同时保留置信区间等统计信息,确保数据集的科学严谨性与建模灵活性。
常用场景
经典使用场景
在非洲公共卫生与营养流行病学研究中,该数据集被广泛用于分析五岁以下儿童消瘦患病率的时空分布格局及其影响因素。研究者可借助其分层维度(如性别、年龄组、城乡居住类型、教育水平及财富五分组),探究不同社会人口学特征下儿童营养状况的差异。数据集覆盖41个非洲国家、跨越1993至2019年的纵向观测,为构建营养风险预测模型、识别高负担热点区域提供了关键数据支撑。
衍生相关工作
基于该数据集,已有研究衍生出多个经典工作方向,例如利用时间序列分析揭示非洲儿童消瘦率的长期下降趋势及其间断点,结合空间统计模型绘制营养不足的非洲大陆风险地图。此外,将消瘦数据与气候、农业产量或冲突事件等外部数据集进行关联分析,已成为探讨粮食安全与健康困境之间动态交互的重要范式。机器学习社区也逐步采纳此数据集作为基准,开展跨国家营养状况的分类与回归预测模型竞赛。
数据集最近研究
最新研究方向
该数据集聚焦于非洲五岁以下儿童消瘦患病率的时空演变与多维不平等性分析,在公共卫生与机器学习交叉领域引发关注。前沿研究常将其与营养政策效应评估、气候-健康关联建模相结合,利用该数据集的高分辨率亚维度(如城乡、财富五分组、教育水平)揭示非洲内部的健康鸿沟。尤其值得瞩目的是,数据集覆盖1993至2019年间的41个非洲国家,为探索全球营养转型与可持续发展目标(SDG 2.2)进展提供了关键基准。近期热点包括利用该数据训练预测模型,以预警消瘦危机高发区域,并与WHO其他指标(如发育迟缓、超重)联动,构建儿童营养不良的多维风险图谱,助力精准干预决策。
以上内容由遇见数据集搜集并总结生成



