electricsheepafrica/africa-who-zero-vegetable-or-fruit-consumption
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-zero-vegetable-or-fruit-consumption
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标6-23个月零蔬菜或水果摄入量(NUT_CF_ZVF)在非洲国家2005年至2021年的国家级观察数据。它是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖40个非洲国家,总行数为3,314行,并按年龄组、教育水平、家庭财富、居住地区类型、性别和财富五分之一等子维度进行分层。
This dataset contains country-level observations for the WHO GHO indicator Zero vegetable or fruit consumption, 6-23 months (NUT_CF_ZVF) across African nations, spanning 2005–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 40 African nations with a total of 3,314 rows and is stratified by sub-dimensions such as age group, education level, household wealth, residence area type, sex, and wealth quintile.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织(WHO)全球卫生观察站(GHO)的OData API,聚焦于非洲地区6至23个月婴幼儿中零蔬果消费比例的指标(NUT_CF_ZVF)。数据经过标准化处理,以Parquet格式重新封装,保留了原始的浮点精度数值,并整合了置信区间上下限(value_low、value_high)等关键统计信息。数据集覆盖2005年至2021年间40个非洲国家的3,314条观测记录,通过统一的列式结构呈现,确保机器学习(ML)任务的直接可用性。
特点
该数据集的核心特色在于其多维分层结构,允许研究者按年龄组、教育水平、家庭财富、居住地类型、性别及财富五等分等子维度进行细分分析。每条记录包含了具体的国家代码、年份、点估计值及其置信区间,并提供了维度类型与数值的标注。这种细粒度的设计使得用户能够灵活地探索不同亚群之间的差异,支持从总体趋势到特定分层群体的深入比较,为非洲儿童营养状况的流行病学研究提供了坚实的数据基础。
使用方法
用户可通过Hugging Face的`datasets`库直接加载数据,调用`load_dataset`函数即可获得包含训练集的表格数据,并轻松转换为Pandas DataFrame进行后续分析。推荐在分析时按需过滤维度,例如通过筛选`dim1`字段中的特定字符串(如`_BTSX`)获取两性合计的全国层面数据,或按国家代码(如`KEN`)提取时间序列,从而高效开展回归、分类或趋势预测等任务。数据集的标准化格式也便于与其他非洲健康数据集进行联合分析。
背景与挑战
背景概述
婴幼儿辅食多样性是衡量儿童营养状况与健康发展的重要指标。世界卫生组织(WHO)全球卫生观察站(GHO)长期监测各国儿童膳食结构,其中“6-23月龄婴幼儿零蔬果摄入比例”直接反映了辅食质量低下这一突出公共卫生问题。该数据集由Electric Sheep Africa团队于2021年从WHO GHO的OData API中提取并重新打包,覆盖2005至2021年间40个非洲国家的3314条观测记录,旨在为机器学习驱动的非洲健康研究提供标准化、可直接使用的结构化数据。数据按国家、年份及多种人口学维度(如性别、居住地、财富五分位等)分层呈现,为深入揭示非洲儿童蔬果摄入缺乏的分布规律与影响因素奠定了数据基础,对推动区域营养政策制定和健康不平等研究具有重要价值。
当前挑战
该数据集所应对的核心领域挑战在于:非洲地区仍有大量婴幼儿未能摄入足量蔬果,从而导致微量元素缺乏、生长发育迟缓和免疫力低下等一系列健康问题,亟需通过精准的数据分析来识别高危人群和关键干预点。在数据构建过程中,首要挑战是处理多维度分层带来的数据稀疏性——同一指标按年龄、性别、教育、财富及居住地等多种维度交叉分组,使得部分组合仅有零星甚至缺失观测,影响模型训练与推断的稳健性。此外,原始API返回的置信区间信息不完整,部分年份与国家的数据缺失,以及不同维度编码体系(如SEX_BTSX与SEX_MLE等)需要统一映射,均增加了数据清洗与特征工程的工作量,要求构建者具备扎实的领域知识与数据处理能力。
常用场景
经典使用场景
在儿童营养与公共卫生研究领域,非洲地区6至23个月婴幼儿蔬果零摄入率数据集(africa-who-zero-vegetable-or-fruit-consumption)承载着世界卫生组织全球卫生观察站(WHO GHO)的权威指标。该数据集最为经典的应用场景是作为监督学习的回归与分类基准,研究者可基于国家、年份、性别、教育水平、居住区域类型及财富五等分等多元维度,构建预测模型以揭示非洲儿童膳食多样性不足的时空演变规律。其结构化格式与一致的数值字段设计,使得跨国家、跨时期的纵向对比分析变得高效可靠,尤其适合机器学习流水线中的特征工程与模型验证环节。
实际应用
在实际公共卫生应用中,该数据集可作为决策支持系统的基石,赋能世界卫生组织非洲区域办事处及各国卫生部进行资源精准投放。例如,开发人员可据此构建交互式仪表盘,实时追踪各国蔬果摄入为零的婴幼儿比例变化趋势,并识别出最需要干预的高风险群体,如农村贫困家庭或低教育水平母亲抚养的儿童。此外,该数据也可嵌入到人工智能驱动的营养预警平台中,通过时间序列分析提前预警可能出现的营养危机区域,协助人道主义组织在粮食援助计划中实现靶向施策,切实改善非洲婴幼儿的膳食质量与生存健康。
衍生相关工作
围绕该数据集已衍生出一系列具有启发性的研究与实践工作,其中最引人注目的是Electric Sheep Africa项目所构建的统一化、机器学习就绪的非洲数据仓库。该仓库将这一指标与其它数百个健康、气候、经济指标进行标准化整合,催生了跨领域的预测分析,例如探究作物产量下降与儿童蔬果摄入率之间的关联。此外,部分学者利用该数据集的置信区间特征,开展了不确定性量化研究,评估模型在稀疏数据下的稳健性。也有开源社区基于此数据集开发了非洲营养状况的基准测试套件,推动了可重复性研究在面向发展中国家的健康机器学习领域中的规范化进程。
以上内容由遇见数据集搜集并总结生成



