five

electricsheepafrica/africa-who-overweight-prevalence-among-children-under-5-years-of-age-nantwhzne2

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-overweight-prevalence-among-children-under-5-years-of-age-nantwhzne2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站指标“5岁以下儿童超重患病率(体重-身高>+2 SD,基于调查的估计)”在非洲国家的国家级观测数据,时间跨度为1985年至2024年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从世界卫生组织全球健康观察站OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator "Overweight prevalence among children under 5 years of age (% weight-for-height >+2 SD), survey-based estimates" (`NUTRITION_ANT_WHZ_NE2`) across African nations, spanning 1985–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源于世界卫生组织全球卫生观察站(GHO)的官方OData API,聚焦非洲地区5岁以下儿童超重患病率(体重指数超过中位数+2个标准差)的调查估算。数据覆盖1985至2024年间47个非洲国家,累计包含26,324条观测记录。所有数值均提取自浮点精度的`NumericValue`字段,并附带置信区间上下限。数据集以Parquet格式统一存储,并通过HuggingFace平台以`electricsheepafrica/africa-who-overweight-prevalence-among-children-under-5-years-of-age-nantwhzne2`标识符发布,隶属于Electric Sheep Africa项目,旨在构建一个面向机器学习的非洲数据统一仓库。
使用方法
用户可通过HuggingFace的`datasets`库便捷加载数据:`load_dataset("electricsheepafrica/africa-who-overweight-prevalence-among-children-under-5-years-of-age-nantwhzne2")`,并可调用`to_pandas()`转换为DataFrame进行后续操作。针对特定分析需求,可通过过滤`dim1`字段筛选如“两性全国水平”(以`_BTSX`结尾)的数据,或按`country_iso3`与`year`排序提取某国的时间序列。数据集支持分类与回归两类任务,适用于营养健康领域的时空分析与模型训练。
背景与挑战
背景概述
非洲地区五岁以下儿童超重问题日益凸显,成为全球公共卫生领域关注的焦点。世界卫生组织(WHO)通过全球卫生观察站(GHO)长期监测该指标,但原始数据分散于不同子系统,缺乏统一、机器可读的整合形式。为此,Electric Sheep Africa团队于2024年将WHO官方API中的非洲国家数据重新打包,构建了涵盖47个国家、跨越1985至2024年的结构化数据集。该数据集以“身高别体重Z评分>+2标准差”为超重判定标准,并细分为年龄组、性别、教育水平、居住地类型等亚维度,为研究非洲儿童营养状况的时空演变、社会分异及政策干预效果提供了标准化基础,有力推动了数据驱动的健康不平等分析与机器学习建模应用。
当前挑战
该数据集所应对的领域核心挑战在于,儿童超重这一公共卫生问题在非洲长期被忽视,缺乏高质量、长时序、多维度可比较数据,致使学界难以精准评估其流行趋势与驱动因素。此外,数据构建面临多重技术挑战:首先,WHO官方OData API的数据结构复杂,部分年份与国家的观测值存在缺失或置信区间不完整,需进行严格的清洗与对齐;其次,不同调查的时间跨度与抽样设计差异显著,跨时期融合需谨慎处理异质性;最后,用户需根据亚维度(如性别、财富五分位)准确筛选恰当的子集,否则可能因错误聚合而引入偏差,要求数据集设计需兼顾灵活性与规范性,这对元数据标注与文档完整性提出了较高要求。
常用场景
经典使用场景
该数据集聚焦于非洲地区五岁以下儿童超重患病率的流行病学评估,基于世界卫生组织全球卫生观察站提供的调查估计数据,以体重-for-身高Z评分超过+2个标准差为判定标准。其经典使用场景涵盖公共卫生领域的跨境趋势分析、营养状况的时间序列建模以及区域间健康不平等的量化研究。通过整合47个非洲国家长达近四十年的观测记录,并辅以年龄组、性别、居住地类型、教育水平及财富指数等多维度分层,该数据集为研究儿童营养转型、城市化进程对膳食模式的影响以及社会经济因素与超重风险的关联提供了坚实的数据基础。
解决学术问题
在学术研究层面,该数据集有效解决了非洲大陆儿童超重流行病学数据碎片化、可比性低的核心困境,为系统综述和荟萃分析提供了统一的高质量数据源。它使得研究者能够深入探究儿童超重的长期变化趋势及其与粮食安全、母乳喂养实践、母亲教育水平及家庭财富积累等关键变量的交互作用,从而揭示了营养不足与营养过剩双重负担并存这一复杂健康挑战的驱动机制。数据集丰富的分层信息还支持多水平模型与因果推断分析,推动了关于非洲地区健康转型理论假说的实证验证,对制定基于证据的公共卫生干预策略具有重要的学术支撑意义。
实际应用
在实际应用场景中,该数据集直接服务于非洲各国卫生部门及国际健康组织(如WHO、UNICEF)的营养监测与评估工作,助力识别超重流行热点地区及高危亚群。其结构化格式便于与地理信息系统、医疗资源分布数据相融合,支持构建儿童营养状况的预测预警系统,为有限医疗资源的最优配置提供量化依据。此外,数据集的可信区间信息使决策者能够评估估计值的波动范围,在制定精准干预措施时兼顾不确定性。该数据集亦为健康素养宣传项目的效果评价、膳食指南的区域适应以及学校营养餐计划的针对性设计提供了关键的基线参照。
数据集最近研究
最新研究方向
在非洲公共卫生领域,儿童超重问题正日益成为营养转型与疾病负担研究的前沿焦点。该数据集聚焦五岁以下儿童体重超标(身高别体重Z评分>+2 SD)的流行率,覆盖47个非洲国家近四十年的调查估算数据,为探究早期生命阶段营养失衡与慢性病风险之间的关联提供了宝贵的时间序列证据。结合世界卫生组织全球卫生观察站的高质量标准化指标,该数据在机器学习驱动的区域健康预测模型中扮演关键角色,助力研究者剖析社会经济分层、城乡差异及教育水平对儿童营养状况的异质性影响。近期热点围绕“营养转型的双重负担”——即在部分非洲国家,消瘦与超重现象并存,该数据集为此类跨维度分析奠定了坚实的数值基础,对指导精准公共卫生干预与政策制定具有深远意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务