five

electricsheepafrica/africa-who-prevalence-of-obesity-among-children-and-adolescents

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-prevalence-of-obesity-among-children-and-adolescents
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家儿童和青少年肥胖患病率的WHO GHO指标数据,时间跨度为1990年至2022年。数据来源于WHO Global Health Observatory OData API,并以Parquet文件的形式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator "Prevalence of obesity among children and adolescents, BMI > +2 standard deviations above the median (crude estimate) (%)" (`NCD_BMI_PLUS2C`) across African nations, spanning 1990–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区儿童与青少年肥胖流行率的国家层面观测数据,时间跨度涵盖1990年至2022年。构建过程中,研究人员以标准化的Parquet文件格式统一存储,并采用一致的架构规范。所有数值均提取自浮点精度的NumericValue字段,而非显示字符串,同时保留了可用的置信区间上下界(value_low与value_high)。数据覆盖47个非洲国家,总计13,959条记录,均来自WHO AFRO区域,通过ParentLocationCode='AFR'筛选。此外,数据集按性别等维度进行了分层,每个国家-年份-维度的独特组合形成独立行,便于细粒度分析。
使用方法
使用该数据集时,可通过HuggingFace的datasets库便捷加载,例如使用load_dataset函数直接导入为高维数组对象,并快速转化为Pandas数据框进行后续分析。针对特定研究需求,用户可运用布尔索引筛选出任意性别(如SEX_BTSX表示两性)或国家层面的数据框。以肯尼亚为例,通过过滤country_iso3为KEN的条目并按年份排序,即可构建时序序列。对于分层数据,如需聚合以消除维度差异,可在过滤dim1为特定值(如全国级)后操作。该设计支持回归与分类任务,并依赖一致的数值列value_numeric作为目标变量,同时利用置信区间评估估计的不确定性,从而适配从描述性统计到复杂预测模型的多样化应用场景。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)于2022年整理发布,并由Electric Sheep Africa团队重新打包为机器学习就绪格式。核心研究问题聚焦于非洲儿童与青少年肥胖流行率的时空演变,通过体重指数(BMI)超过中位数两个标准差以上的粗估计值进行量化。数据集覆盖47个非洲国家,时间跨度为1990至2022年,以国家层面的年度观测数据为基础,并依据性别等维度进行分层。作为非洲健康数据统一存储库的重要组成部分,该数据集为全球健康不平等研究、公共卫生政策制定以及机器学习在健康预测中的应用提供了关键支持,尤其在肥胖相关非传染性疾病的监测与干预领域产生了广泛影响。
当前挑战
该数据集首先应对的是非洲地区儿童与青少年肥胖率持续攀升带来的公共卫生挑战,这一问题源于膳食结构变化、城市化进程加速及身体活动减少等多重因素,亟需精准的数据支持以识别高风险群体并优化资源分配。在构建过程中,挑战源自对WHO原始OData API的异构数据整合,包括跨年代、跨国家的数据碎片化及格式不一致性,需要设计统一的Parquet架构与结构化字段(如置信区间与分层维度)来确保数据相容性。此外,部分观测存在置信区间缺失,数据稀疏性与时变性对机器学习模型的鲁棒性提出了更高要求,实现从粗估计到精准预测的跨越仍面临巨大障碍。
常用场景
经典使用场景
该数据集聚焦于非洲国家儿童与青少年肥胖患病率,以体重指数超过中位数两个标准差以上的粗估计值为核心指标。它覆盖47个非洲国家1990至2022年的时序观测,并提供了按性别分层的子维度(男女及两性合并)。研究者通常利用该数据进行时间序列预测、跨区域对比分析,以及评估肥胖流行趋势在不同性别群体中的分布特征。数据集的结构化字段——包括点估计值、置信区间和维度标识——使其成为流行病学建模和公共卫生监测的理想训练资源。
解决学术问题
在学术研究中,该数据集协助破解了多个长期困扰非洲儿童健康领域的难题。它系统性地提供了非洲大陆层面的肥胖患病率长期追踪数据,弥补了该区域高质量健康数据不足的空白。基于此,研究者能够定量分析经济发展、城市化进程与儿童肥胖率之间的关联,评估性别不平等对健康结局的调节作用。此外,数据集的置信区间字段为贝叶斯推断、不确定性量化和缺失值插补提供了关键支撑,赋能了非洲儿科肥胖风险因素的多层次建模。
实际应用
实际应用中,该数据集为世界卫生组织非洲区域办事处的健康政策制定提供了数据基础。各国卫生部门可借助其产出绘制肥胖高发区与高危人群热力图,设计针对性的营养干预和身体活动促进项目。非政府组织与联合国儿童基金会可利用时间序列结果监测可持续发展目标中关于非传染性疾病预防的进度。同时,数据科学家可将其整合到实时监控仪表盘或移动健康应用中,辅助卫生工作者进行早期预警和资源调配。
数据集最近研究
最新研究方向
在全球非传染性疾病防控与儿童青少年健康促进领域,该数据集聚焦于非洲大陆儿童及青少年肥胖率(以BMI超过中位数2个标准差为临界值)的长期演变趋势。结合世界卫生组织全球健康观测站(WHO GHO)的权威数据,研究正深入探索1990至2022年间47个非洲国家的肥胖流行特征,揭示性别、居住地类型等亚维度下的差异,并利用机器学习方法构建预测模型,以应对非洲地区快速营养转型与城市化带来的健康挑战。这一工作为理解儿童肥胖的驱动因素、评估干预措施效果、以及制定区域性公共卫生政策提供了关键数据支撑,尤其在资源有限的环境中具有深远意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务