five

electricsheepafrica/africa-who-exclusive-breastfeeding-under-6-months

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-exclusive-breastfeeding-under-6-months
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在1990年至2009年间,世界卫生组织全球健康观察站(WHO GHO)指标“6个月以下纯母乳喂养率(%)”(`NUTRITION_579`)的国家级观察数据。数据集是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator "Exclusive breastfeeding under 6 months (%)" (`NUTRITION_579`) across African nations, spanning 1990–2009. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的官方OData接口,聚焦于非洲地区6个月以下婴儿纯母乳喂养率的宏观健康指标(代码NUTRITION_579)。数据经过系统化清洗与重构,以Parquet格式存储,并采用统一的列式架构。所有数值均取自原始数据中的浮点型字段NumericValue,而非字符串展示值,同时保留了置信区间上下界等统计信息。数据集涵盖了1990年至2009年间42个非洲国家的107条观测记录,每条记录代表一个特定国家与年份的组合,且支持按性别等维度进行分层筛选,丰富了分析视角。
特点
该数据集具备高度结构化与机器学习就绪的特性,所有字段类型清晰明确,核心目标变量value_numeric为浮点精度,可直接用于回归或分类任务。数据集中包含indicator_code、country_iso3、year等关键标识列,便于跨数据集融合与时间序列分析。此外,dim1与dim2列提供了按性别或居住区域类型等维度的细粒度分层信息,允许研究者精确筛选所需子群。数据集大小不足千条,但覆盖了42个非洲国家,兼顾了广度与代表性,适合用于区域性健康政策评估与纵向趋势建模。
使用方法
用户可通过HuggingFace的datasets库直接加载该数据集,调用load_dataset函数即可获取训练集,并支持转换为Pandas DataFrame进行后续操作。典型用法包括按国家筛选分析单一国家的时间序列,例如使用条件过滤country_iso3列为‘KEN’的数据;或通过滤除dim1列中非全性别标记(如SEX_BTSX)的行来获取全国层面的估计值。该数据集也支持按年份排序以观察趋势变化,并可结合置信区间列进行不确定性分析,适合用于卫生经济学建模与政策效果评估。
背景与挑战
背景概述
在全球公共卫生领域,婴幼儿营养状况始终是衡量人口健康水平与发展潜力的关键指标。由世界卫生组织(WHO)全球卫生观察站(GHO)发布的非洲地区6个月内纯母乳喂养率数据集(NUTRITION_579),由Electric Sheep Africa团队于2024年前后整理并托管于HuggingFace平台,覆盖1990年至2009年间42个非洲国家的107条记录。该数据集聚焦于评估非洲地区婴幼儿早期喂养实践,为研究母乳喂养行为变迁、营养干预政策效果及区域健康不平等提供了标准化、机器可读的数值型数据基础,在流行病学、营养学及健康数据科学领域具有重要参考价值。
当前挑战
该数据集所面临的挑战首先体现在领域问题上:非洲地区母乳喂养率受文化习俗、社会经济地位、医疗可及性及冲突动荡等多重因素交织影响,单一指标难以捕捉喂养行为的复杂性,且跨时间纵向分析常受限于数据稀疏性与监测中断。在构建过程中,挑战源自WHO OData API的异构接口与数据格式转换,需将字符串型显示值稳健解析为浮点型数值并保留置信区间,同时处理多维度分层(如性别、城乡)导致的重复行、缺失值及不一致编码,确保数据清洗与模式统一的可靠性。
常用场景
经典使用场景
在公共卫生与营养学领域,africa-who-exclusive-breastfeeding-under-6-months数据集以其对非洲大陆42个国家长达二十年(1990-2009年)纯母乳喂养率的系统记录,成为评估婴幼儿营养干预效果的核心资源。该数据集最经典的使用场景在于构建时间序列回归模型或分类任务,用以分析非洲各国纯母乳喂养率的变化趋势及其与政策实施、社会经济因素的关联。研究者可据此识别喂养实践的薄弱环节,为制定针对性公共卫生策略提供量化依据。
衍生相关工作
围绕该数据集,学界已衍生出多项标志性工作。例如,有研究将其与国家贫困率、农村人口比例等指标关联,构建了非洲纯母乳喂养的社会生态学模型。另有工作基于该数据训练梯度提升机,预测2010年后非洲各地区喂养率的演变轨迹。国际食物政策研究所(IFPRI)也将其作为核心变量,用于评估农业营养项目在改善儿童健康方面的干预效果。这些工作均以该数据集为起点,拓展了营养流行病学与机器学习交叉领域的研究边界。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区1990至2009年间6个月内婴儿纯母乳喂养率的跨国时序变化,为评估联合国可持续发展目标中关于营养与儿童健康的进展提供了关键基准。结合WHO全球卫生观察站数据,当前研究前沿正利用此类精细化、具备置信区间的结构化指标,构建机器学习模型以预测营养干预成效,尤其在资源匮乏区域探索母乳喂养与社会经济、医疗可及性之间的非线性关联。该数据集的整合与开放,推动了非洲健康数据科学从传统统计向AI驱动政策的转型,为制定针对性公共卫生策略奠定了数据基础,并响应了全球对减少婴儿营养不良与死亡率的紧迫关切。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务