electricsheepafrica/africa-who-minimum-dietary-diversity-6-23-months
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-minimum-dietary-diversity-6-23-months
下载链接
链接失效反馈官方服务:
资源简介:
本数据集包含非洲国家2005年至2021年间关于世界卫生组织全球健康观察指标“6-23个月婴儿最低饮食多样性”(NUT_CF_MDD)的国家级观察数据。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,包含数值估计和置信区间等信息。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适用于机器学习的非洲数据存储库。数据集覆盖40个非洲国家,总行数为3,320行,包含多个子维度,如年龄组、教育水平、家庭财富等。
This dataset contains country-level observations for the WHO GHO indicator "Minimum dietary diversity 6-23 months" (`NUT_CF_MDD`) across African nations, spanning 2005–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家6至23个月婴幼儿最低膳食多样性指标(NUT_CF_MDD)。研究者通过API接口直接获取原始数值型数据(NumericValue),摒弃显示字符串,以确保数据精度。在此基础上,数据被重新封装为Parquet格式文件,并附加置信区间上下限(value_low、value_high)以增强统计可靠性。数据集覆盖2005至2021年间40个非洲国家的3320条观测记录,每条观测对应特定国家、年份及多维度分层(如年龄组、性别、教育水平、居住地类型等),形成系统化的结构化表格数据。
使用方法
使用者可通过Hugging Face的datasets库轻松加载数据,调用load_dataset函数获取训练集,并转换为Pandas DataFrame进行后续操作。为聚焦特定分析,可依据dim1字段过滤维度,例如筛选标识为_SEX_BTSX的行以获取全国总人口数据,或通过country_iso3字段提取单个国家的时间序列。数据集的结构化特性支持直接用于分类与回归任务,其数值型目标列value_numeric适合作为预测变量,而置信区间列则可用于不确定性建模。建议在建模前根据研究问题选择或聚合相应维度,以消除分层带来的偏差。
背景与挑战
背景概述
婴幼儿时期的营养摄入对个体终身健康与发展具有奠基性作用,膳食多样性作为衡量喂养质量的关键指标,受到世界卫生组织(WHO)与全球公共卫生领域的高度重视。该数据集由Electric Sheep Africa团队于2023年前后整理发布,核心数据来源于WHO全球卫生观察站(GHO),聚焦于非洲地区6至23月龄婴幼儿最低膳食多样性指标(NUT_CF_MDD),涵盖2005至2021年间40个非洲国家的3,320条观测记录。研究团队通过统一的数据模式与Parquet格式对原始OData接口数据进行再封装,旨在为机器学习驱动的非洲健康分析提供标准化、可复用的数据资源。该数据集填补了非洲膳食多样性精细化时序数据的空白,为评估区域营养政策效果、探究社会经济分层与喂养实践之间的关联提供了重要的实证基础,对推动非洲儿童营养健康研究的定量化与模型化具有显著贡献。
当前挑战
该数据集所解决的核心领域问题在于,非洲地区婴幼儿膳食多样性信息长期分散且异质性高,缺乏统一规范、可机读的时序数据集以支撑跨国家、跨时期的比较分析与预测建模。在构建过程中,首要挑战是数据来源的异构性——原始WHO GHO接口返回的指标常附带多重分层维度(如年龄组、性别、居住地类型、教育水平与财富五等分),如何设计合理的数据库模式以保留这些分层信息同时保持表格的可用性,成为关键难点。此外,置信区间的低值和高值字段存在大量空值,需谨慎处理缺失模式以避免下游建模偏差。不同国家、不同年份的数据采集标准与更新频率不一,导致时间序列不均衡,进一步增加了时空建模与泛化评估的复杂程度。这些挑战要求使用者具备分层数据处理与缺失值插补的专业能力,方能充分挖掘数据集的分析潜力。
常用场景
经典使用场景
在婴幼儿营养与公共卫生研究领域,该数据集最经典的用途是用于衡量和追踪6至23个月龄婴幼儿的膳食多样化状况。研究者常利用该数据集评估不同非洲国家在特定年份中,达到最低膳食多样化标准的儿童比例,并进一步分析其在不同性别、年龄组、教育水平、居住区域及家庭财富水平下的分布差异。通过国家层面的纵向数据,可系统性地刻画膳食多样化随时间演变的趋势,为制定针对性的营养干预政策提供数据支撑。
解决学术问题
该数据集有效解决了多项学术研究中的关键难题。首先,它填补了非洲地区婴幼儿膳食多样化长期监测数据的空白,使得研究者能够克服以往因数据稀疏而无法进行跨国比较分析的困境。其次,数据中包含置信区间等统计信息,为评估指标的不确定性和显著性检验提供了基础。基于此,学者可以探讨膳食多样化与儿童生长迟缓、消瘦等营养状况之间的关联,并量化社会经济因素与膳食质量之间的交互作用,从而推动营养流行病学理论的发展与实践干预的精准化。
实际应用
在实际应用层面,该数据集为国际组织、政府卫生部门及非政府组织提供了可操作的决策参考。项目管理人员可以依据不同国家、区域及亚群体的膳食多样化水平,优先安排资源向最脆弱的群体倾斜,例如乡村地区或财富水平较低的儿童。此外,数据集可用于监测可持续发展目标中与消除饥饿和改善营养相关的具体指标。公共卫生政策的制定者也能借助此数据,评估既往营养改善措施的有效性,并调整未来策略的方向。
数据集最近研究
最新研究方向
当前,非洲大陆婴幼儿膳食多样性不足问题持续引发国际公共卫生领域的深切关注。该数据集聚焦WHO推荐的6-23月龄婴幼儿最低膳食多样性指标(NUT_CF_MDD),覆盖40个非洲国家2005至2021年的时空观测数据,为量化评估区域营养转型进程提供了关键实证基础。前沿研究正借助此数据,结合家庭财富阶层、母亲教育水平及城乡居住地等多维分层变量,深入剖析膳食多样性在性别、年龄亚群间的异质性演变轨迹,并与同期全球粮食危机、气候变化冲击等热点事件联动,揭示脆弱群体营养脆弱性的驱动机制。此类数据驱动的精细刻画,不仅为非洲各国调整母婴营养干预策略提供了循证依据,更推动了机器学习在公共卫生监测中从单纯预测向因果推断与政策模拟的范式跃迁。
以上内容由遇见数据集搜集并总结生成



