five

electricsheepafrica/africa-who-infants-exclusively-breastfed-for-the-first-six-months-of

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-infants-exclusively-breastfed-for-the-first-six-months-of
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“婴儿在前六个月纯母乳喂养的百分比”(WHOSIS_000006)在非洲国家的国家级观察数据,时间跨度为1986年至2020年。它是Electric Sheep Africa系列的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Infants exclusively breastfed for the first six months of life (%)" (`WHOSIS_000006`) across African nations, spanning 1986–2020. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源于世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,聚焦于非洲地区“婴儿生命前六个月纯母乳喂养比例(%)”这一关键健康指标。数据经由Electric Sheep Africa项目团队系统性地从WHO GHO的OData API中提取、清洗并重构为统一模式的Parquet文件格式。所有数值均采用浮点精度的NumericValue字段,并保留了置信区间上下界(value_low与value_high),以确保数据精度与统计完整性。数据集覆盖1986至2020年间45个非洲国家的263条观测记录,每条记录对应单一国家与年份的组合,不包含子维度分层,数据结构简洁明了。
使用方法
使用者可通过HuggingFace Datasets库便捷地加载该数据集,只需一行代码即可将数据转化为Pandas DataFrame格式,便于后续分析。针对群体分析需求,建议过滤出dim1为“_BTSX”结尾或为空的行,以获取全国层面的男女综合纯母乳喂养率。若需追踪特定国家的时序变化,可基于country_iso3字段进行筛选并按时序排序,从而生成国家级的趋势线。该数据集还可轻松融入回归或分类任务,以value_numeric作为回归目标,或基于阈值转换为分类标签,适用于非洲公共卫生政策评估与干预效果建模等工作。
背景与挑战
背景概述
婴幼儿纯母乳喂养率是全球公共卫生领域核心评价指标之一,世界卫生组织(WHO)自1986年起便通过全球卫生观察站(GHO)系统追踪各国“婴儿出生后前六个月纯母乳喂养比例”。该数据集由Electric Sheep Africa团队于2020年前后整理发布,汇集了覆盖45个非洲国家、跨度长达34年(1986–2020)的263条可机读观测记录,旨在为机器学习与统计分析提供标准化、可直接使用的非洲健康数据资源。数据源自WHO官方OData API,经统一格式重构为Parquet文件,并保留置信区间等关键质量字段,填补了非洲大陆在宏观健康数据与人工智能应用之间的数据鸿沟,对推动地区婴幼儿营养干预策略的循证研究具有重要基础性价值。
当前挑战
该数据集所解决的领域问题在于:长期以来,非洲地区婴幼儿纯母乳喂养状况常因数据零散、格式异构或获取门槛高而难以进入机器学习建模流程,导致区域间喂养模式差异、政策干预效果评估及预测分析缺乏可靠的数据支撑。而在构建过程中,面临的挑战包括:原始WHO数据接口返回的字段存在缺失值与显示字符串,需从‘NumericValue’中提取精确浮点值并统一处理置信区间边界(value_low/value_high);不同国家上报年份不均匀,1986年至2020年间仅累积263条记录,稀疏时间序列对模型泛化能力构成考验;此外,数据中部分样本存在按性别、居住地类型等维度分层(如dim1字段),需在下游任务中甄别选择,避免因混杂维度引入分析偏差。
常用场景
经典使用场景
该数据集广泛应用于非洲婴儿纯母乳喂养率的时空演变分析,为公共卫生研究者提供了一份跨越1986至2020年、涵盖45个非洲国家的纵向观测数据。其经典使用场景在于构建回归模型或分类任务,以揭示社会经济、地理环境及政策干预对母乳喂养行为的影响。通过统一的结构化字段,研究者可轻松提取特定国家或年份的数值,并进行跨国对比与时间序列预测,从而为区域健康政策的制定提供数据支撑。
解决学术问题
该数据集有效解决了非洲地区婴幼儿营养领域长期存在的数据稀疏与标准不一的问题,填补了跨国、长时序纯母乳喂养率系统记录的空白。学术上,它使得量化分析母乳喂养趋势与儿童生存率、营养状况及传染病负担之间的关联成为可能,推动了健康地理学与流行病学中的跨国比较研究。其意义在于为验证世界卫生组织(WHO)推行的纯母乳喂养倡议效果提供了实证基础,并助力揭示健康不平等现象背后的结构性因素。
实际应用
在实际应用中,该数据集为非洲各国卫生部门及国际组织(如联合国儿童基金会)监测和评估母乳喂养推广项目的成效提供了关键工具。它被用于识别喂养率持续低迷的国家或区域,指导资源优先配置与干预策略的精细化调整。例如,结合置信区间数据,决策者可评估调查估值的可靠性,从而在卫生政策制定中更精准地设定阶段性目标,提升母婴健康项目的实施效率与透明度。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区婴儿纯母乳喂养率这一关键公共卫生指标,为探究撒哈拉以南非洲婴幼儿营养状况与可持续发展目标(SDG 2.2)的关联提供了宝贵的时序数据支撑。研究前沿正借助此类细粒度数据,利用机器学习建模揭示社会经济、气候环境及政策干预对喂养行为的非线性影响,尤其关注新冠疫情前后喂养模式的突变与韧性。其标准化、即用型的Parquet格式与置信区间字段,极大降低了数据整合成本,助力跨区域比较分析与预测预警,为WHO及非洲各国制定精准营养干预策略提供了实证基石。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务