electricsheepafrica/africa-who-children-aged-5-years-wasted-for-age
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-children-aged-5-years-wasted-for-age
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家WHO GHO指标5岁以下儿童消瘦率(%)(NUTRITION_564)的国家级观测数据,时间跨度为1975年至2015年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的模式。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖了47个非洲国家,总行数为645行。
This dataset contains country-level observations for the WHO GHO indicator Children aged <5 years wasted for age (%) (NUTRITION_564) across African nations, spanning 1975–2015. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 47 African nations with a total of 645 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集聚焦于非洲地区5岁以下儿童消瘦患病率的流行病学指标(NUTRITION_564),数据源自世界卫生组织全球卫生观察站(WHO GHO)的OData API。通过系统化地爬取与清洗,将原始API响应中的浮点精度字段NumericValue作为核心定量依据,并同步提取上下置信区间边界(value_low与value_high)。所有观测值均按国家、年份及可能的分层维度(如性别SEX)进行结构化整合,最终以Parquet格式存储,形成了一致性良好的机器学习就绪数据集,共涵盖47个非洲国家、1975至2015年间645条记录。
特点
该数据集的核心特色在于其层次分明的多维结构与高数据完整性。除了点估计值外,同时提供置信区间信息,便于不确定性量化。数据集内置了性别(SEX_BTSX、SEX_FMLE、SEX_MLE)等子维度,允许用户按需筛选全国总量或特定亚群分析。所有记录均采用ISO 3166-1 alpha-3国家代码进行标准化,并附带WHO区域标识符(AFR),极大便利了跨国家、跨时间序列的纵向比较与区域聚合分析。
使用方法
数据集通过HuggingFace Datasets库即可直接加载为Pandas DataFrame,方便后续建模与可视化。用户可通过过滤dim1字段中后缀为_BTSX的值或保留空值行来提取男女合计的全国层面数据。对于国别研究,可对country_iso3列执行等值筛选,如选取'KEN'后按年份升序排列即可获得肯尼亚的时间序列。此外,建议用户对value_numeric列进行缺失值处理,并利用value_low与value_high列开展不确定性分析或误差带绘制。
背景与挑战
背景概述
该数据集源自世界卫生组织全球卫生观察站,聚焦于非洲地区5岁以下儿童消瘦比例的监测,由Electric Sheep Africa团队于近年整理并发布至HuggingFace平台。儿童消瘦作为衡量急性营养不良的核心指标,直接关联着非洲大陆长期面临的粮食安全与公共卫生挑战。数据集覆盖1975至2015年间47个非洲国家的645条观测记录,为研究儿童营养状况的时空演变、评估干预政策效果提供了标准化、机器学习就绪的数据基础。作为非洲健康数据统一整合的典范,该数据集填补了区域精细化营养研究的数据缺口,推动了流行病学建模与可持续发展目标监测领域的进展。
当前挑战
构建该数据集面临的核心挑战在于整合来自不同年代、不同统计口径的纵向卫生数据,确保跨国家与跨年份的一致性与可比性。原始数据常因缺失值、置信区间标注不一或维度分层复杂(如性别与居住地类型)而难以直接用于建模。尽管数据集提供了清晰的架构,但性分层与全国层级的取舍、早年观测稀疏等问题仍需谨慎处理。此外,从WHO API获取的数值与展示字符串间可能存在差异,如何准确提取浮点型估计值并保留统计不确定性,对数据清洗与模型输入设计构成了专业技术挑战。
常用场景
经典使用场景
该数据集聚焦于非洲5岁以下儿童消瘦患病率(Weight-for-age wasting)的时空分布,涵盖1975至2015年间47个非洲国家的官方统计指标。作为世界卫生组织全球卫生观察站(GHO)的核心营养监测指标(NUTRITION_564),数据集以结构化表格形式呈现,包含点估计值与置信区间,并支持按性别(SEX_BTSX, SEX_FMLE, SEX_MLE)等维度进行分层分析。研究人员常利用其进行跨国家、跨时段的儿童营养不良严重程度追踪,或将其作为回归分析中的目标变量,探索社会经济、冲突或气候因素与营养危机的关联。
解决学术问题
该数据集直面非洲儿童营养不良流行病学中数据稀疏与可比性差的长期挑战。通过统一编码标准(ISO 3166-1 alpha-3)、标准计量单位(百分比)及时间跨度覆盖,它回答了‘哪些非洲国家在哪些时期出现了儿童消瘦的显著恶化或改善’这类关键问题。学术研究可借助这一高质量结构化数据,验证营养不良干预措施(如粮食援助计划)的有效性,或构建预测模型揭示冲突爆发、干旱等冲击对营养状况的滞后影响,为全球营养转型理论提供非洲大陆的实证依据。
衍生相关工作
基于该数据集的经典工作包括:利用时间序列模型(如ARIMA或高斯过程)拟合1975-2015年各国消瘦率轨迹,识别非洲‘营养转型’中与西非萨赫勒干旱带重叠的持续热点区域;结合维度(性别)变量开展元分析,揭示女性儿童在部分牧区社会中营养剥夺更为严重的性别不平等模式;以及作为‘非洲健康数据仓库’(Electric Sheep Africa)的标准化模块,与HIV感染率、清洁水源覆盖率等指标联合训练多任务学习模型,探讨营养不良与传染病的协同流行机制。
以上内容由遇见数据集搜集并总结生成



