electricsheepafrica/africa-who-egg-andor-flesh-food-consumption-6-23-months
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-egg-andor-flesh-food-consumption-6-23-months
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)关于非洲国家6-23个月婴幼儿蛋类和/或肉类食品消费情况的指标数据(NUT_CF_EFF),时间跨度为2005年至2021年。数据集是Electric Sheep Africa项目的一部分,该项目旨在提供一个统一的、适合机器学习使用的非洲数据仓库。数据直接从WHO GHO的OData API获取,并以Parquet文件形式重新打包,保持一致的架构。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖40个非洲国家,包含3,314条记录,并支持按年龄组、教育水平、家庭财富等多个子维度进行筛选或聚合。
This dataset contains country-level observations for the WHO GHO indicator "Egg and/or Flesh Food Consumption 6-23 months" (`NUT_CF_EFF`) across African nations, spanning 2005–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 40 African nations and contains 3,314 rows, with support for filtering or aggregating across multiple sub-dimensions such as age group, education level, and household wealth.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区6至23月龄婴幼儿的蛋类与肉类食物消费指标(NUT_CF_EFF)。数据历经严格筛选,仅保留WHO AFRO区域内的40个非洲国家观测值,时间跨度覆盖2005年至2021年。原始API返回的数值字段经标准化处理,以浮点精度存储为`value_numeric`,同时保留置信区间上下限及格式化展示字符串。针对指标本身的多维分层特性(如年龄组、性别、居住地类型等),数据集将每一国家与年份下的各子维度组合拆解为独立记录,并以`dim1`和`dim2`字段清晰标识,最终以Parquet格式封装,形成统一、易于机器学习摄取的表格结构。
特点
该数据集的核心特色在于其高维度的分层覆盖与精细的粒度划分。涵盖六大子维度:年龄组、教育水平、家庭财富、居住地类型、性别及财富五分位数,每个维度均包含多个层级,如年龄从6-11月到12-23月的具体分段,以及教育从无到高等的完整谱系。这使研究者能够针对特定亚群(如农村女性或最贫困家庭)进行精准分析。数据集总计收录3314条记录,每行均包含点估计值及其置信区间,为统计推断提供了坚实基础。此外,其来源为权威的WHO官方数据,且以CC BY 4.0许可开放,确保了可靠性与可复现性。
使用方法
使用者可通过HuggingFace的`datasets`库便捷加载数据,调用`load_dataset`函数直接获得训练集格式的对象,并一键转换为Pandas DataFrame进行探索。为快速获取全国层面的总体估计,可依据`dim1`字段筛选以`_BTSX`结尾的性别类别或空值行。针对特定国家的时序分析,则可通过`country_iso3`字段过滤并依年份排序,例如提取肯尼亚的全部记录。数据列如`value_low`与`value_high`为不确定性量化提供了直接支持,而`dim1_type`与`dim2_type`则帮助用户理解分层变量的具体含义,便于自定义聚合或建模前的特征工程。
背景与挑战
背景概述
该数据集源自世界卫生组织全球卫生观察站(WHO GHO),由Electric Sheep Africa团队于2021年整理发布,聚焦非洲地区6至23月龄婴幼儿的蛋类和/或肉类食物消费情况。作为一项关键的营养指标(编码NUT_CF_EFF),该数据覆盖2005年至2021年间40个非洲国家,包含年龄、性别、教育水平、居住地类型及家庭财富等多维分层信息,为评估婴幼儿辅食质量与膳食多样性提供了标准化、机器可读的公开资源。在儿童营养不良高发的非洲大陆,这一数据集填补了区域级精细化营养监测数据的空白,推动了公共卫生领域的机器学习建模与政策分析,对实现可持续发展目标中的零饥饿与良好健康具有重要学术与实际影响力。
当前挑战
该数据集面临的核心挑战在于其反映的领域问题:非洲地区6至23月龄婴幼儿辅食多样性普遍不足,蛋类和肉类等优质蛋白质来源的摄入率长期偏低,易导致隐性饥饿与发育迟缓。构建过程中,跨年度、跨国别的数据一致性面临考验——不同国家的调查方法、抽样设计与时点差异需统一;同时,数据存在缺失值(如置信区间不全)和细粒度分层导致的稀疏性问题,部分子维度组合观测数极少。此外,从WHO GHO的OData API原始接口转换至机器学习友好的Parquet格式时,需处理字符串与数值字段的歧义,确保数值精度与降维聚合的准确性,这些步骤对模型的鲁棒性与可比性构成显著挑战。
常用场景
经典使用场景
在非洲儿童营养与健康研究领域,该数据集被广泛用于分析6至23个月婴幼儿的蛋类及肉类食物消费模式。研究人员借助其细颗粒度的分层维度——包括年龄组、性别、居住地类型(城乡)、教育水平及家庭财富五分位——能够精准刻画不同社会经济背景下婴幼儿膳食多样性的差异。通过时间序列(2005—2021年)与跨国(40个非洲国家)的双重视角,学者得以追踪喂养实践的动态演变,并评估公共卫生干预措施对改善婴幼儿营养状况的长期效果。
实际应用
在实际应用层面,该数据集为世界卫生组织及各非洲国家的公共卫生决策提供了量化依据。政策制定者可通过分析不同财富五分位和城乡分组下的消费率,精准定位营养不良高风险群体,并据此设计针对性的营养干预方案,例如推广低成本的高蛋白辅食生产或开展社区喂养教育项目。数据中按教育水平与财富分层的信息,还助力评估既有扶持政策的覆盖公平性,确保稀缺资源优先流向最需要帮助的儿童群体。
衍生相关工作
基于该数据集,学界已衍生出多项具有影响力的后续工作。例如,结合其他WHO营养指标(如最低膳食多样性评分)构建综合性婴幼儿喂养质量指数,以更全面地评估干预效果。此外,有研究利用其长期面板结构配合贝叶斯层次模型,预测撒哈拉以南非洲地区未来十年的辅食改善趋势。部分工作还将其与人口健康调查数据融合,通过多源数据交叉验证,强化了对“消费端营养安全”问题的因果推断能力。
以上内容由遇见数据集搜集并总结生成



