five

electricsheepafrica/africa-who-prevalence-of-overweight-among-children-and-adolescents

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-prevalence-of-overweight-among-children-and-adolescents
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标儿童和青少年超重流行率,BMI超过中位数+1个标准差(粗略估计)百分比(NCD_BMI_PLUS1C)在非洲国家的国家级观察数据,时间跨度为1990年至2022年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO全球健康观察OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Prevalence of overweight among children and adolescents, BMI > +1 standard deviations above the median (crude estimate) (%) (NCD_BMI_PLUS1C) across African nations, spanning 1990–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站OData API,涵盖了非洲地区47个国家自1990年至2022年间儿童与青少年超重患病率的观察数据。原始数据经过系统化整理,以Parquet文件格式保存,并采用一致的架构标准。所有数值均基于浮点精度的'数值字段',而非显示字符串,同时纳入了可用的置信区间上下限。数据还通过性别等维度进行了分层,每个独特的国家、年份与维度组合形成独立的观测行,从而实现了对多维度信息的精确捕获。
特点
数据集的核心特点在于其高度的结构化与机器学习就绪性,共包含13,959条记录,覆盖了非洲大陆广泛的时空范围。其架构设计细腻,除核心的患病率点估计值外,还附带了置信区间信息,为统计推断提供了坚实的数据基础。此外,通过'维度类型'与'维度值'字段,研究者能够轻松按性别(如男女合计、男性、女性)或居住地类型等亚组进行数据筛选与分析,极大地增强了数据集的灵活性与分析深度。
使用方法
使用者可通过Hugging Face的'load_dataset'函数便捷地加载该数据集,并将其转换为Pandas DataFrame进行后续分析。例如,研究人员可以过滤出'dim1'字段以'BTSX'结尾或为空的行,从而获取仅针对两性合计的全国层面数据。对于趋势分析,则可按国家ISO代码筛选特定国家,并依据年份字段进行排序,以构建时间序列模型或观察超重患病率的历史演变。该数据集的设计使其天然适用于分类与回归两类机器学习任务。
背景与挑战
背景概述
随着儿童青少年超重问题在全球范围内日趋严峻,非洲地区因其独特的社会经济与营养转型轨迹而备受关注。世界卫生组织全球健康观测站(WHO GHO)于2022年发布了“NCD_BMI_PLUS1C”指标,专门衡量儿童与青少年中体质指数超过中位数一个标准差的超重流行率。该数据集由Electric Sheep Africa团队整理,覆盖1990年至2022年间47个非洲国家的13,959条观测记录,以统一、机器学习友好的Parquet格式重新封装,旨在填补非洲地区高质量、结构化健康数据的空白。通过整合按性别等维度分层的精细化信息,该数据集为研究非洲儿童青少年超重的时空分布、驱动因素及干预效果提供了关键基础,有力推动了全球非传染性疾病预防与营养健康领域的交叉研究。
当前挑战
该数据集所应对的领域挑战在于,非洲儿童青少年超重问题长期缺乏系统、一致的监测数据,导致区域间比较困难、政策制定缺乏实证支撑。同时,构建过程中面临多重技术难点:首先,WHO原始OData API返回的数值需要从多种显示格式中提取一致的浮点精度值,避免字符串解析误差;其次,数据按性别或居住区域等维度分层,每一国家与年份的组合可能产生多条记录,需建立清晰的过滤与聚合逻辑;再者,置信区间字段存在大量缺失值,需合理处理;最后,覆盖时间跨度长达32年且涉及47个国家,数据更新与版本维护的自动化流程要求极高。这些挑战共同决定了该数据集在构建时必须在数据清洗、标准化与可复现性之间取得精细平衡。
常用场景
经典使用场景
在非洲儿童与青少年超重流行病学研究中,该数据集被广泛用于分析体重指数(BMI)超过中位数一个标准差以上的人口比例及其时空演变规律。研究者可结合国家、年份、性别和城乡居住地等多维分层信息,构建纵向面板数据模型,以揭示非洲区域超重问题的动态趋势与地域差异。尤其适用于利用粗估计值开展的大规模描述性分析与健康不平等量化研究。
衍生相关工作
该数据集衍生了一系列重要工作,包括构建非洲儿童超重时空地图的可视化项目,以及开发基于面板数据的时间序列预测模型。相关研究利用该数据验证了社会经济地位、城镇化率与超重率之间的非线性关系,推动了多层贝叶斯模型在低资源区域健康指标估计中的应用。此外,该数据集被整合进更广泛的非洲健康指标机器学习基准库,成为后续非洲非传染性疾病风险因素研究的关键数据基石。
数据集最近研究
最新研究方向
该数据集聚焦于非洲儿童与青少年超重流行率的长期趋势分析,结合世界卫生组织全球健康观察站的标准化BMI指标,为研究非洲地区营养转型与肥胖负担提供了关键数据支撑。在非传染性疾病防控的前沿探索中,这一资源正助力学者挖掘性别、地域等亚组差异,揭示超重与经济社会变迁之间的复杂关联。相关研究可能对接全球肥胖流行热点,推动区域健康政策的精准制定,同时为机器学习模型在公共卫生领域的应用奠定基础,其年代跨度(1990–2022)与完整置信区间记录更增强了纵向分析与干预效果评估的可靠性。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务