electricsheepafrica/africa-who-early-initiation-of-breastfeeding-nutbfeibf
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-early-initiation-of-breastfeeding-nutbfeibf
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在1991年至2021年间关于世界卫生组织全球健康观察指标早期母乳喂养,过去24个月内出生的儿童(NUT_BF_EIBF)的国家级观察数据。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并重新打包为具有一致模式的Parquet文件。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖44个非洲国家,4499行数据,并包含多个子维度,如教育水平、家庭财富、居住地区类型等。
This dataset contains country-level observations for the WHO GHO indicator "Early Initiation of Breastfeeding, Children born in the last 24 months" (`NUT_BF_EIBF`) across African nations, spanning 1991–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 44 African nations with 4,449 rows and includes multiple sub-dimensions such as education level, household wealth, residence area type, etc.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,针对非洲地区1991至2021年间“出生后24个月内婴儿早期母乳喂养”这一关键公共卫生指标,进行了系统性的数据清洗与整合。数据以Parquet格式存储,统一提取原始的浮点精度数值字段(NumericValue)作为核心测度,并纳入置信区间上下限等辅助指标。每一观测行对应一个国家、年份及其可能的社会经济分层维度组合,构建了一个机器学习就绪的标准化数据集。
特点
数据集覆盖44个非洲国家的4449条观测记录,时间跨度逾三十年,具备丰富的地域与时间代表性。其显著特点在于多维分层结构,包含教育水平、家庭财富、居住区域类型、性别及财富五分位数等五个子维度,允许研究者针对不同亚群体进行分析。数据清晰区分了点估计值、置信区间及显示字符串,并完整保留了分层变量的元数据标签,便于筛选与聚合计算。
使用方法
使用者可通过HuggingFace的`load_dataset`函数便捷地加载该数据集,并将其转换为Pandas DataFrame进行后续分析。典型操作包括:利用`dim1`与`dim2`字段过滤特定分层(如仅保留两性合计的国家级数据),或按`country_iso3`与`year`列提取特定国家的时间序列。数据集可直接应用于分类或回归任务,例如预测母乳喂养率的变化趋势或评估公共卫生政策干预效果。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2021年整理发布,源自世界卫生组织(WHO)全球卫生观察站(GHO)的开放数据,核心关注非洲地区24个月内出生婴儿的早期母乳喂养启动率(指标代码NUT_BF_EIBF)。数据覆盖44个非洲国家,时间跨度从1991年至2021年,共计4,449条观测记录。作为非洲地区公共卫生领域的重要数据资源,该数据集为评估和改善婴幼儿营养健康提供了关键定量依据,尤其为研究低收入国家母乳喂养行为的社会经济决定因素及干预效果提供了可靠支撑,对推动非洲地区实现可持续发展目标中关于降低儿童死亡率和促进母婴健康的相关指标具有显著影响力。
当前挑战
该数据集着力应对多项挑战。首先,在领域问题层面,早期母乳喂养启动率是衡量母婴健康的核心指标,但非洲地区长期缺乏标准化、跨国家、长时序的公开数据,导致区域间比较分析和政策效果评估难以开展。其次,在构建过程中,数据整合面临显著困难:原始WHO GHO数据以多维度分层形式发布,涉及教育水平、家庭财富、居住地类型、性别及财富五等分等复杂细分变量,每一国家-年份组合因分层可能产生多条记录,需精心设计以统一模式解析和重组。此外,部分数据存在置信区间缺失情况,数据时间跨度长达30年且来源不一,对一致性校验与质量保障形成了严峻挑战。
常用场景
经典使用场景
在公共卫生与营养学交叉研究领域,该数据集常被用于构建时序预测模型与分类任务,以剖析非洲地区产后一小时内母乳喂养启动率的变化趋势。研究者在国家层面或按教育水平、居住地类型、家庭财富指数等分层维度,追踪1991至2021年间44个非洲国家的早期母乳喂养数据,借助回归分析或机器学习算法识别关键影响因子,从而为政策制定者提供基于证据的干预切入点。
衍生相关工作
该数据集衍生出一系列聚焦非洲母婴健康的基准研究,例如基于国家面板数据的随机森林模型用于预测母乳喂养趋势,以及分层贝叶斯模型解析教育公平与喂养行为间的非线性关系。此外,Electric Sheep Africa项目同步发布的关联数据集(如儿童营养不良指标)常被联合用于多变量分析,催生了探讨早期喂养与后续发育迟缓关联的因果推断工作,推动了非洲本地化健康指标的标准化与机器学习友好型数据集建设。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区母乳喂养早期启动率的时空演化与多维度社会经济学差异分析。在儿童营养与公共卫生领域,最新的前沿研究方向已从单纯的时间序列监测转向探索教育水平、家庭财富、居住区域类型及性别等分层维度对喂养行为的交互影响。借助WHO全球卫生观察站提供的1991至2021年间的标准化面板数据,研究者正致力于构建机器学习回归模型以预测指标变化趋势,并识别高维特征中的关键干预节点。同时,该数据集在整合母婴健康与可持续发展目标的实证研究中扮演着基石角色,尤其在与非洲区域营养改善计划、降低五岁以下儿童死亡率等热点政策议题关联时,为揭示不平等现象并指导精准健康资源配置提供了坚实的数据支持。
以上内容由遇见数据集搜集并总结生成



