electricsheepafrica/africa-who-introduction-of-solid
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-introduction-of-solid
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家1999-2021年间世界卫生组织全球健康观察站(WHO GHO)指标NUT_CF_ISSSF(6-8个月大婴儿引入固体、半固体或软食物的比例)的国家级观测数据。数据直接来自WHO GHO OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度),而非显示字符串。在可用情况下,还包括置信区间边界(value_low,value_high)。数据集是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。
This dataset contains country-level observations for the WHO GHO indicator Introduction of solid, semi-solid or soft foods 6-8 months (`NUT_CF_ISSSF`) across African nations, spanning 1999–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,经过系统化采集与结构化处理而成。数据聚焦于非洲地区6至8月龄婴儿引入固体、半固体或软质食品的指标(NUT_CF_ISSSF),覆盖1999至2021年间44个非洲国家的3792条观测记录。所有数值均采用高精度的浮点型字段(NumericValue),并同步保留置信区间上下界(value_low和value_high)。为适配机器学习任务,原始数据被重新打包为统一的Parquet格式,并按照Electric Sheep Africa项目规范进行模式标准化,确保跨数据集的一致性与可复用性。
特点
该数据集具有鲜明的多维分层特性,除了国家与年份两大核心维度外,还深度整合了教育水平(EDUCATIONLEVEL)、家庭财富(HOUSEHOLDWEALTH)、居住区域类型(RESIDENCEAREATYPE)、性别(SEX)及财富五分位组(WEALTHQUINTILE)等社会人口学子维度。当指标存在分层时,每个国家-年份-维度的独特组合均以独立行呈现,研究者可通过dim1和dim2字段精准筛选所需子群。这种精细的粒度设计,使得复杂的社会经济差异分析成为可能,为理解非洲婴幼儿营养干预效果提供了丰富的数据支撑。
使用方法
用户可通过HuggingFace Datasets库便捷加载该数据集,单行命令即可完成数据的导入与处理。典型使用路径包括:对指定国家进行时间序列分析,如提取肯尼亚(KEN)的历史数据并按年份排序;或通过过滤dim1字段中SEX_BTSX等标签,聚焦两性平衡的国家总体水平。数据集同样支持跨维度聚合运算,分析者可根据研究假设灵活组合教育、财富或居住区域等分层变量,开展从描述性统计到预测建模的全链条分析工作。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2023年整理发布,源自世界卫生组织全球卫生观察站(WHO GHO),聚焦非洲44个国家在1999年至2021年间6-8月龄婴幼儿引入固体、半固体或软质食物的喂养指标(NUT_CF_ISSSF)。婴幼儿辅助食品引入时机是儿童营养与健康领域的关键监测指标,直接影响儿童生长发育、营养不良风险及长期健康结局。该数据集以统一结构化的表格格式呈现,涵盖教育水平、家庭财富、居住地类型、性别及财富五分位等多个亚维度分层观测值,为机器学习驱动的非洲公共卫生研究提供了高质量、可复用的数据基础,显著推动了区域儿童营养状况的量化分析与政策评估。
当前挑战
该数据集面临的核心挑战包括三个方面:一是领域问题层面,非洲地区婴幼儿喂养实践受文化习俗、经济条件、医疗卫生可及性等多因素交织影响,精准识别辅助食品引入时机的决定因素并预测其健康效应极为复杂;二是数据构建层面,原始WHO数据来源于各国调查,存在国别间调查方法、时间跨度及样本代表性不一致的问题,导致跨国家、跨年份的可比性受限;三是数据稀疏性与分层复杂性,部分国家关键年份缺乏观测值,且按教育、财富等维度分层后,子组样本量锐减,增加了模型训练的噪声与过拟合风险。
常用场景
经典使用场景
该数据集聚焦于非洲地区6至8月龄婴儿引入固体、半固体或软食物的喂养实践,涵盖1999至2021年间44个非洲国家的观测数据。其经典使用场景在于评估和追踪非洲各国在婴幼儿辅食添加时机上的达标率,分析教育水平、家庭财富、居住地区及性别等亚组维度下的差异。研究者通常利用该数据进行时间序列分析,描绘辅食引入率随年份的演变趋势,或通过多维分层比较,揭示社会经济因素如何影响喂养行为,为公共卫生干预措施的效果评估提供量化依据。
解决学术问题
在学术研究中,该数据集有效解决了非洲地区婴幼儿喂养指标数据分散、格式不统一且不易获取的难题。它支撑了关于辅食添加与儿童营养不良关联性的宏观分析,帮助学者探讨早期营养干预对降低发育迟缓率的意义。通过纳入置信区间,数据集增强了统计推断的可靠性,使得跨国家、跨时期的比较研究成为可能,进而为世界卫生组织及各国制定针对性营养政策提供了实证基础,推动了全球儿童健康公平性的学术讨论。
衍生相关工作
围绕该数据集,已有研究工作形成了若干衍生范式。例如,学者们将其与同一系列的其他WHO指标(如母乳喂养率、最低膳食多样性)联合建模,构建多维度婴幼儿喂养质量评价体系。此外,基于亚组信息的机器学习模型被开发用于预测辅食引入趋势,并识别关键驱动因素。该数据集也催生了针对非洲区域饥饿地图绘制的研究,通过空间插值技术填补数据稀疏地区的营养信息空白,进一步拓展了其在计算社会学与全球健康交叉学科中的应用边界。
以上内容由遇见数据集搜集并总结生成



