electricsheepafrica/africa-who-overweight-numbers-among-children-under-5-years-of-age
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-overweight-numbers-among-children-under-5-years-of-age
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“5岁以下儿童超重人数(千),基于模型的估计”(`NUTOVERWEIGHTNUM`)在非洲国家的国家级观察数据,时间跨度为2000年至2024年。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。
This dataset contains country-level observations for the WHO GHO indicator "Overweight numbers among children under 5 years of age (thousands), model-based estimates" (`NUTOVERWEIGHTNUM`) across African nations, spanning 2000–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区5岁以下儿童超重人数(以千计)的模型估算值。Electric Sheep Africa团队对原始数据进行了系统性重打包,统一转化为Parquet格式,并设计了高度一致的Schema结构。数据筛选依据WHO AFRO区域代码(ParentLocationCode = 'AFR'),最终收录了47个非洲国家从2000年至2024年间的3525条观测记录。每条观测均包含指标代码、国家ISO3代码、年份、数值及置信区间上下限,并按照性别等子维度进行了分层,如SEX_BTSX、SEX_FMLE、SEX_MLE等,确保了多维度分析的灵活性。
使用方法
数据集可通过HuggingFace的datasets库便捷加载,仅需一行代码即可转换为Pandas DataFrame进行后续操作。使用时建议首先过滤出全国性数据(如筛选dim1以SEX_BTSX结尾或为空的行),以获取宏观趋势。针对时间序列分析,可按国家代码(country_iso3)与年份(year)排序,例如选取肯尼亚(KEN)的数据进行逐年演变分析。若需对比不同性别的差异,则可通过dim1字段的取值(如SEX_FMLE与SEX_MLE)进行分组聚合。对于机器学习建模,可直接将value_numeric作为回归目标,或利用value_high和value_low构建区间预测任务。
背景与挑战
背景概述
儿童超重问题已成为全球公共卫生领域的重要议题,尤其在资源有限的非洲地区,精确的流行病学数据对于制定干预政策至关重要。由世界卫生组织(WHO)全球卫生观测站(GHO)于2024年发布的“africa-who-overweight-numbers-among-children-under-5-years-of-age”数据集,由Electric Sheep Africa团队重新整理并托管于HuggingFace平台,聚焦非洲47个国家2000至2024年间5岁以下儿童超重人数(以千计)的模型估算值。该数据集基于WHO的NUTOVERWEIGHTNUM指标构建,包含3525条观测记录,覆盖性别、居住地类型等亚维度分层信息,为机器学习驱动的区域健康监测与时空流行病学分析提供了标准化、可直接使用的数据基础,对推动非洲儿童营养健康研究的定量化与预测建模具有重要影响力。
当前挑战
该数据集所解决的领域核心挑战在于,非洲多国缺乏可靠的儿童超重监测数据,传统调查方法受限于低资源环境下的数据采集成本与质量,导致在时空覆盖和颗粒度上存在显著空白。建模过程中面临的挑战包括:如何从WHO提供的分层数据中准确提取并重构国家级的点估计值及其置信区间,如何协调不同国家在年份、性别、城乡等维度上的数据稀疏性与不一致性,以及如何将多源异构的原始API响应转化为具备一致Schema的机器学习就绪格式,从而在保持统计可靠性的同时,降低下游建模的预处理负担。
常用场景
经典使用场景
在儿童健康与营养流行病学领域,该数据集被广泛用于构建多变量回归模型,以探究非洲国家五岁以下儿童超重人数的时空演变趋势。研究者常将其与经济发展、粮食安全、卫生服务可及性等宏观指标进行联合分析,从而揭示社会经济因素对儿童营养状况的纵深影响。此外,数据集所提供的置信区间为不确定性量化提供了坚实基础,使得预测模型更贴近真实公共卫生情境。
解决学术问题
该数据集有效破解了非洲大陆长期缺乏统一、结构化的儿童超重监测数据这一学术瓶颈。通过整合世界卫生组织全球健康观测站的模型估算结果,消除了国别间数据采集标准不一、年份缺失等障碍,使得跨国对比研究和区域健康风险评估成为可能。这为探索儿童营养过渡期中的肥胖负担转移机制、评估可持续发展目标中营养相关指标的进展提供了高频且可靠的数据支撑。
实际应用
在实际公共卫生决策层面,该数据集可辅助非洲各国卫生部门及国际组织(如WHO、UNICEF)进行营养干预项目的优先级排序与资源分配。基于数据中分性别、分时间序列的国家级估算值,政策制定者能够精准定位超重问题高发区域,评估既往干预措施的效果,并动态调整儿童肥胖防控策略。同时,该数据也为全球健康监测平台及流行病学预警系统提供了标准化的输入接口。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区五岁以下儿童超重人数(单位:千)的模型估计值,覆盖2000至2024年47个非洲国家,由世界卫生组织全球卫生观察站提供并经由Electric Sheep Africa项目重新整合为机器学习就绪格式。在当前全球儿童营养与肥胖问题日益受到关注的背景下,这一数据集为探究非洲儿童超重趋势、性别差异及区域分布提供了关键的量化基础。前沿研究方向主要体现在利用其分层维度(如性别)与置信区间进行时空建模与不确定性分析,以揭示儿童超重流行的驱动因素与社会经济关联。该数据集与联合国可持续发展目标中关于消除一切形式营养不良的倡议紧密相连,通过提供标准化、可复用的数据资源,推动机器学习在非洲公共卫生监测中的应用,助力精准干预策略的制定与资源优化配置。
以上内容由遇见数据集搜集并总结生成



