electricsheepafrica/africa-who-early-initiation-of-breastfeeding-bfearly
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-early-initiation-of-breastfeeding-bfearly
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在1993年至2019年间关于世界卫生组织全球健康观察站(WHO GHO)指标“早期母乳喂养(调查前两年内)的百分比”(`bfearly`)的国家级观测数据。数据来源于WHO GHO OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。
This dataset contains country-level observations for the WHO GHO indicator "Early initiation of breastfeeding (in the two years preceding the survey) (%)" (`bfearly`) across African nations, spanning 1993–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(GHO)的OData API,经过规范化的数据清洗与重打包流程,将原始指标'bfearly'(产后两小时内的初乳喂养率)转化为机器学习友好的Parquet格式。所有观测值均取自高精度的NumericValue字段,而非格式化字符串,并保留了置信区间上下界。数据覆盖1993年至2019年间42个非洲国家的6031条记录,每条记录代表一个特定国家、年份与亚维度(如性别、年龄组、居住地类型)组合下的单一观测行。
使用方法
通过HuggingFace Datasets库可一键加载数据集,调用`load_dataset('electricsheepafrica/africa-who-early-initiation-of-breastfeeding-bfearly')`即可获得格式统一的训练集。用户可通过过滤dim1字段中的`_BTSX`后缀快速筛选全国总体数据,或依据`country_iso3`和`year`列进行时间序列与跨国比较。研究者亦可根据亚维度字段(如SEX、RESIDENCEAREATYPE)灵活分层抽样,支持多元回归、面板数据分析及机器学习建模等下游任务。
背景与挑战
背景概述
在公共卫生领域,母乳喂养的早期启动被视为降低新生儿死亡率和促进婴幼儿健康的关键干预措施。世界卫生组织(WHO)自上世纪90年代起便持续监测全球各国的母乳喂养实践,其中“早期启动母乳喂养率”是评估母婴健康政策成效的核心指标之一。为此,WHO全球卫生观察站(GHO)系统性地收集了来自42个非洲国家1993年至2019年间共计6031条观测数据,形成了本数据集。该数据集由Electric Sheep Africa团队整理发布,旨在将分散的官方统计资料转化为可直接用于机器学习研究的结构化资源,为定量分析非洲地区母乳喂养实践的时间演变、区域差异及社会分层特征提供了坚实的数据基础,对理解健康不平等和制定精准干预措施具有重要价值。
当前挑战
该数据集所面临的挑战主要来自两个方面。在领域问题层面,尽管数据涵盖多个国家与长达数十年的跨度,但非洲各国在调查方法、样本代表性及数据质量标准上存在显著差异,这给跨时空比较和因果推断带来了方法学困难。此外,母乳喂养行为受文化习俗、教育水平、财富状况及城乡分布等多重因素交织影响,本数据集虽提供了年龄组、教育等级、居住地类型和财富五分位等分层维度,但这些社会决定因素的复杂交互效应仍需通过严谨的因果模型加以解析。在构建过程中,原始数据来源于WHO OData API且包含多个调查项目(如DHS和MICS)的编码体系,不同来源的维度标签(如地域编码DHSMICSGEOREGION)缺乏统一映射,需进行繁琐的数据清洗与标准化;同时,部分观测缺失置信区间,且数据以长格式存储,多维度交叉组合导致稀疏性问题,对后续建模和统计分析提出了挑战。
常用场景
经典使用场景
该数据集汇聚了世界卫生组织全球卫生观察站关于非洲国家产后两小时内早期母乳喂养启动率的纵向监测数据,覆盖1993年至2019年间42个非洲国家的6031条观测记录。在公共卫生与流行病学研究中,它常被用于评估区域间早期母乳喂养实践的时间演变趋势与空间分布特征,研究者可依据国家、年份、性别、城乡居住类型、教育水平及财富五分位等分层维度进行细粒度分析,从而揭示影响母乳喂养行为的社会经济与人口学因素。
解决学术问题
该数据集为破解非洲地区早期母乳喂养率长期偏低的学术难题提供了关键实证基础。通过构建多层级回归模型与空间流行病学分析,研究人员得以量化国家政策、卫生系统覆盖水平及文化习俗对母乳喂养启动时间的独立贡献与交互效应。相关研究显著推动了联合国可持续发展目标中关于降低新生儿死亡率、促进婴幼儿健康成长的指标监测与政策评估,其包含的置信区间信息更增强了统计推断的可靠性。
实际应用
在实际应用层面,该数据集为非洲各国卫生部门制定和优化母乳喂养促进策略提供了数据驱动的决策支持。公共卫生机构可利用其按教育水平、财富阶层和城乡分组的数据,精准识别弱势群体并设计针对性干预措施。世界卫生组织及联合国儿童基金会亦能通过跨年代纵向指标,评估“爱婴医院”倡议等全球卫生运动在非洲的实施效果,并动态调整资源配置与宣传重点。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区早期母乳喂养率的时空演变与健康公平性分析,为全球卫生监测与机器学习交叉领域注入新动能。近年来,依托WHO全球卫生观察站逾二十年的分层数据(涵盖国家、年龄、教育、财富五分位数等维度),研究者得以精准剖析社会经济地位、地域差异与喂养行为间的深层关联,尤其在探究非洲各国在2015年联合国可持续发展目标(SDGs)框架下的进展与瓶颈时,该数据集成为量化评估“婴幼儿营养改善”核心指标的关键引擎。其与母婴死亡率、营养不良等新发关注的联动分析,正在推动机器学习模型在低资源医疗场景下的可解释性与外推力革新,为制定区域性、靶向性公共卫生干预策略提供了数据驱动的决策基石。
以上内容由遇见数据集搜集并总结生成



