five

electricsheepafrica/africa-who-minimum-meal-frequency-6-23-months

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-minimum-meal-frequency-6-23-months
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家WHO GHO指标“6-23个月婴儿最低餐食频率”(NUT_CF_MMF)的国家级观察数据,时间跨度为2006年至2021年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了40个非洲国家,总共有3,134行数据。

This dataset contains country-level observations for the WHO GHO indicator "Minimum Meal Frequency 6-23 months" (`NUT_CF_MMF`) across African nations, spanning 2006–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 40 African nations with a total of 3,134 rows.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在婴幼儿营养状况监测的全球性议题中,世界卫生组织(WHO)提出的“最低膳食频率(6-23个月)”指示剂(代号NUT_CF_MMF)是评估辅食喂养质量的关键指标。该数据集依托于WHO全球卫生观察站(GHO)的OData API接口,系统性采集了2006年至2021年间40个非洲国家的国家层级观测数据。原始数据经由Electric Sheep Africa团队进行清洗与重构,统一转换为Parquet文件格式,并保留了浮点精度的数值型字段(NumericValue)作为核心机器学习目标,同时嵌入置信区间下界(value_low)与上界(value_high)以供不确定性分析。数据集涵盖了性别、年龄段、教育水平、家庭财富、居住区域类型及财富五分组等多个维度子层,当指标按维度分层时,每个独特的国家×年份×维度组合均生成独立行记录,从而实现了结构化存储。
特点
该数据集的核心特色在于其跨领域整合的丰富分层架构与非洲区域聚焦的独特定位。通过内置性别(SEX)、年龄段(AGEGROUP从6-11月至12-23月不等的细分)、教育程度(EDUCATIONLEVEL涵盖无教育至高等教育)、家庭财富(HOUSEHOLDWEALTH区分底部40%至顶部80%)、居住区域(RESIDENCEAREATYPE含城乡与总体)以及财富五分组(WEALTHQUINTILE)六大类共计30余个子维度,研究者能够精准剖析营养指标在不同社会人口群体中的差异性。数据覆盖40个非洲国家、跨越15年时间窗,共计3134条记录,且全部来源于WHO确认的AFR区域,提供了高度一致且机器可读的量化框架。此外,数据集在HuggingFace上以CC BY 4.0许可发布,原始数据由WHO官方授权,兼具权威性与可复用性。
使用方法
使用该数据集进行营养流行病学或机器学习分析时,可通过HuggingFace的datasets库直接加载,调用load_dataset函数后即可获得训练集并转换为Pandas DataFrame进行操作。研究者可通过筛选dim1字段中后缀为_BTSX或缺失值的行,快速提取两性总体且国家层级的无偏估计值,从而聚焦于宏观趋势。针对特定国家的纵向分析,例如肯尼亚的时间序列研究,可依据country_iso3代码(如KEN)结合year字段进行排序与过滤。对于需要考量人口统计学因素的建模任务,应利用dim1_type与dim2_type字段定位具体的分层变量(如SEX或RESIDENCEAREATYPE),并借助value_low与value_high置信区间验证预测的稳定性。该数据集直接适用于表格分类与回归任务,是探究非洲学龄前儿童辅食喂养实践与社会决定因素关联的宝贵资源。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队基于世界卫生组织(WHO)全球卫生观察站(GHO)的公开数据构建,于2023年左右发布,旨在系统监测非洲地区6-23个月婴幼儿的最低膳食频率(NUT_CF_MMF)。核心研究问题聚焦于通过可量化的指标评估非洲国家婴幼儿辅食喂养的充足性,从而为改善儿童营养状况提供数据支撑。数据集覆盖2006至2021年间40个非洲国家的3,134条观测记录,整合了年龄、教育水平、家庭财富、居住地类型和性别等多维分层变量,极大促进了跨国家、跨时期的比较研究。作为非洲健康大数据标准化的重要尝试,该数据集为机器学习驱动的公共卫生决策提供了高质量的基线资源。
当前挑战
该数据集所应对的领域挑战在于,婴幼儿营养监测往往依赖于分散的、缺乏标准化的调查数据,难以支撑精准的跨区域建模与政策干预。具体而言,不同国家在数据采集方法、指标定义和缺失值处理上的差异构成了整合难题。在构建过程中,数据集面临多重挑战,包括从WHO OData API中清洗和解析异构的数值与显示字符串,处理置信区间信息的不完整性,以及确保国家代码、分层维度(如年龄组和教育水平)的一致性。此外,时间跨度的不均衡(部分国家年份稀疏)和分层组合的稀疏性(如特定维度交叉后样本量极少)增加了机器学习模型泛化的难度。
常用场景
经典使用场景
该数据集聚焦于非洲地区6至23个月婴幼儿的最低进餐频率指标,是评估婴幼儿喂养实践与营养状况的核心监测工具。在公共卫生与儿童营养研究领域,研究者常用该数据集追踪各国历年婴幼儿膳食多样性与进餐频次的变化趋势,识别营养干预的薄弱环节。通过解析性别、居住地类型、教育水平及家庭财富等分层维度,学者能够深入剖析社会经济因素对喂养行为的影响,为制定精准的营养改善策略提供数据支撑。
实际应用
在实际应用层面,该数据集可直接服务于非洲各国卫生部门的营养监测与项目评估工作。例如,政府与非政府组织可据此识别进餐频率低于阈值的国家与弱势群体,优化食品援助与营养教育资源的分配。研究机构可构建预测模型,模拟经济增长、教育普及或城镇化进程对喂养行为的影响,辅助制定中长期干预路线图。此外,该数据集作为机器学习友好的结构化资源,便于集成到自动化监测平台中,实现营养状况的实时预警与动态追踪。
衍生相关工作
基于该数据集,学术界已衍生出一系列经典工作,涵盖多国营养指标的联合建模、喂养行为的空间异质性分析以及社会经济驱动因素的因果推断等方向。例如,研究者将其与其他WHO营养指标(如最低膳食多样性、最低可接受膳食)相结合,构建综合性婴幼儿喂养质量指数。此外,该数据集的标准化格式还推动了非洲健康数据仓库的建设,催生了跨指标、跨国家的元分析研究,并成为深度学习模型预测区域性营养不良风险的基准数据源之一。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作