electricsheepafrica/africa-who-continued-breastfeeding-12-23-months
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-continued-breastfeeding-12-23-months
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标12-23个月婴儿持续母乳喂养(NUT_BF_CBF)在非洲国家的国家级观察数据,时间跨度为1986年至2021年。它是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖45个非洲国家,总行数为4,564条,并包含多个子维度如教育水平、家庭财富、居住地区类型等。
This dataset contains country-level observations for the WHO GHO indicator Continued breastfeeding 12-23 months (NUT_BF_CBF) across African nations, spanning 1986–2021. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 45 African nations with a total of 4,564 rows and includes sub-dimensions such as education level, household wealth, residence area type, etc.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据API,聚焦于非洲国家1986年至2021年间“12-23个月婴儿持续母乳喂养率”这一关键健康指标。数据以统一架构的Parquet文件格式重新封装,所有观测值均采用浮点精度的NumericValue字段,而非显示字符串,并附带了置信区间上下界。涵盖了45个非洲国家的4564条记录,每条记录代表了特定国家、年份及其可能的分层维度组合,依据教育水平、家庭财富、居住地类型、性别及财富五分位数等子维度进行细致划分。
特点
该数据集最显著的特点在于其丰富且规范的分层结构,允许用户从多个社会学与人口统计学维度(如教育程度、财富状况、城乡分布)对持续母乳喂养率进行精细剖析。数据经过清洗与标准化处理,可直接用于机器学习任务,支持分类与回归分析。此外,每个观测值均包含点估计值与置信区间,为不确定性量化提供了可靠支撑。其时间跨度长达35年,地域覆盖广泛,为非洲地区儿童营养状况的纵向与横向比较研究奠定了坚实基础。
使用方法
用户可通过HuggingFace Datasets库便捷加载数据。推荐使用`load_dataset`函数将数据转换为Pandas DataFrame格式进行后续分析。对于全国层面的分析,建议过滤`dim1`列为`SEX_BTSX`或为空的行,以获取两性合计的总体估计。若要考察特定国家的时间序列趋势,可按`country_iso3`字段筛选并依据`year`列排序。研究者亦可通过`dim1_type`与`dim2_type`字段选择特定子维度,如性别或居住地类型,以实现针对性的分层分析。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)创建,经Electric Sheep Africa团队重新封装,聚焦非洲地区12-23个月婴儿持续母乳喂养率这一关键公共卫生指标。数据集覆盖1986至2021年间45个非洲国家的4,564条观测记录,通过教育水平、家庭财富、居住地类型、性别及财富五分位等多维度分层呈现,为研究非洲婴幼儿营养状况提供了标准化、机器可读的统计基础。作为非洲健康数据统一存储库的一部分,该数据集填补了该领域高质量、结构化开放数据的空白,对推动非洲区域公共卫生政策评估与机器学习模型训练具有重要价值。
当前挑战
该数据集所解决的领域问题核心挑战在于:非洲地区12-23个月婴儿持续母乳喂养率受社会经济地位、教育程度、城乡差异等多因素交织影响,缺乏系统性、多维度的标准化数据支撑政策制定与干预效果评估。构建过程中面临的挑战包括:跨45个国家长达35年的历史数据整合中,不同来源的指标定义与数据格式存在差异,需统一转化为一致架构的Parquet文件;部分年份或国别的数据存在缺失或置信区间边界未记录的情况,需审慎处理以保证数据集完整性与模型训练可靠性;此外,分层维度(如教育水平、财富五分位)的多样组合导致数据冗余与稀疏性并存,对高效存储与检索提出了工程化要求。
常用场景
经典使用场景
该数据集的核心价值在于为非洲地区婴幼儿持续母乳喂养率(12-23个月)的时空建模提供标准化的结构化数据支撑。研究者可基于国家、年份、性别、教育水平、居住地类型及财富五分位数等多维分层字段,构建宏观趋势分析模型或面板数据回归框架。通过提取国家层面的点估计值及其置信区间,能够系统刻画1986至2021年间非洲各国在婴幼儿喂养实践上的动态演变轨迹。
衍生相关工作
围绕该数据集已衍生出多项深具影响的经典工作,包括利用面板数据挖掘喂养率与女性教育水平、家庭财富指数之间的长期协整关系,以及基于时空图网络对非洲大陆低喂养率热点区域的早期预警框架。部分研究还将其与儿童生长发育数据集进行联合建模,揭示了持续母乳喂养在降低生长发育迟缓风险中的非线性保护效应。这些工作不仅拓展了公共卫生数据集成的边界,也为机器学习在流行病学中的应用提供了范式参考。
数据集最近研究
最新研究方向
在非洲公共卫生领域,联合国儿童基金会与世界卫生组织持续推动的婴幼儿喂养监测体系中,该数据集聚焦于12至23个月婴幼儿持续母乳喂养率这一关键指标,涵盖了1986至2021年间45个非洲国家的时序观测数据。当前前沿研究方向集中于利用该分层数据集(按教育水平、家庭财富、居住地类型及性别等维度细分)构建预测模型,以揭示社会经济不平等对母乳喂养持续性的深层影响,并结合地理空间分析技术探索区域差异背后的政策干预效果。借助机器学习方法,研究者可模拟不同干预场景下的喂养率变化趋势,为后疫情时代非洲各国优化母婴健康策略、缩小营养差距提供数据驱动型决策支持,其意义在于将碎片化的调查数据转化为可操作的公共卫生智能工具。
以上内容由遇见数据集搜集并总结生成



