five

electricsheepafrica/africa-who-minimum-acceptable-diet-6-23-months

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-minimum-acceptable-diet-6-23-months
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“6-23个月最低可接受饮食”(NUT_CF_MAD)在非洲国家的国家级观察数据,时间跨度为2009年至2021年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来自WHO GHO OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Minimum Acceptable Diet 6-23 months" (`NUT_CF_MAD`) across African nations, spanning 2009–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家6-23个月婴幼儿最低可接受饮食指标(NUT_CF_MAD)。数据经由系统化抽取与重构,以Parquet格式存储,并保持统一的字段结构。所有数值均采用浮点精度的`NumericValue`字段,而非格式化显示的字符串。若指标按性别、年龄组等维度进行分层,则每个独特的国家-年份-维度组合均生成独立行,同时保留可用的置信区间上下界,确保数据粒度的完整性与分析灵活性。
特点
本数据集涵盖2009至2021年间39个非洲国家的2677条记录,覆盖WHO非洲区域全部国家。核心特色在于其多维分层结构,包括年龄组、教育水平、家庭财富、居住区域类型、性别及财富五分位等六个子维度,允许研究者从不同社会人口学角度剖析婴幼儿膳食质量。数据经批量化整理为机器学习就绪格式,既包含点估计值作为主要预测目标,也附带了置信区间,便于不确定性量化与稳健性评估。
使用方法
用户可通过HuggingFace Datasets库的`load_dataset`函数直接加载数据,返回的Dataset对象可便捷地转换为Pandas DataFrame进行后续分析。针对全国水平分析,可筛选`dim1`列以`_BTSX`结尾或为空的行;若要追踪特定国家的时间序列,如肯尼亚,只需按`country_iso3`列过滤并依`year`排序。此外,利用多维分层变量,研究者可灵活聚合或细分数据,以满足不同研究假设的验证需求。
背景与挑战
背景概述
婴幼儿时期的营养摄入对个体终身健康具有决定性影响,其中6至23月龄是补充喂养的关键窗口期。世界卫生组织(WHO)将“最低可接受膳食”(Minimum Acceptable Diet, MAD)作为评估婴幼儿膳食质量的核心指标,其综合考量了膳食多样性和喂养频率。由世界卫生组织全球卫生观察站(GHO)创建并于2021年发布的非洲地区MAD数据集,汇集了2009至2021年间39个非洲国家的观测数据,经Electric Sheep Africa团队统一整理为机器学习友好格式。该数据集为量化分析非洲婴幼儿营养状况、追踪可持续发展目标进程提供了标准化、可复用的数据基础,显著推动了区域公共卫生决策的数据驱动转型。
当前挑战
该数据集所解决的领域核心挑战在于,非洲地区婴幼儿营养不良问题严峻,但缺乏统一、可比较的膳食质量评估指标和高质量时序数据。构建过程中面临的挑战包括:整合来自WHO OData API的庞杂原始数据,将其从多种展示字符串统一为浮点型数值,并保留置信区间;处理多维度分层(如年龄组、教育水平、财富五分位等)带来的高维稀疏性,确保每个国家-年份-维度组合的完整记录;以及跨越39个国家的数据口径一致性维护,以保障跨区域分析的可靠性。这些挑战的克服使该数据集成为机器学习模型预测和政策制定的可靠基座。
常用场景
经典使用场景
在婴幼儿营养与公共卫生研究领域,该数据集最经典的应用场景是评估非洲地区6至23月龄婴幼儿的膳食质量,具体通过计算达到“最低可接受膳食”标准的儿童比例。研究者常利用该数据分析不同国家、年份、性别、居住地类型(城乡)及家庭财富水平下的膳食状况差异,从而勾勒出区域营养不平等的宏观图景。数据集中包含的分层维度,如年龄组、教育水平和财富五分位数,使得跨群体比较成为可能,为深入理解哪些社会人口因素最显著地影响婴幼儿营养摄入提供了量化基础。
实际应用
在实际应用层面,该数据集为非洲各国的公共卫生决策提供了直接的数据支撑。政府部门和国际组织可基于不同地区和人群的“最低可接受膳食”达标率,识别营养干预的优先区域和目标群体。例如,将城市与农村、不同财富阶层之间的膳食差异可视化,有助于设计更有针对性的补充喂养计划和社会安全网项目。此外,数据集中按教育水平分层的信息可引导营养教育资源的分配,使健康传播策略更聚焦于知识薄弱群体,从而提升干预措施的成本效益。
衍生相关工作
该数据集衍生了若干具有影响力的研究工作,尤其在机器学习与全球健康交叉领域。研究者利用其结构化表格特性,开发了面向低收入地区婴幼儿营养状况的分类与回归预测模型,例如利用梯度提升机(如XGBoost)和随机森林算法,将国家层面的社会经济指标、地理协变量与膳食数据联合建模,实现了对缺失年份或未观测国家营养指标的精准估算。此外,基于该数据的时间序列结构,涌现了一批采用长短期记忆网络(LSTM)进行营养趋势预测的基准工作,推动了深度学习在公共卫生监测中的应用边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作