five

electricsheepafrica/africa-who-prevalence-of-obesity-among-adults-ncdbmi30a

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-prevalence-of-obesity-among-adults-ncdbmi30a
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“成年人肥胖率(BMI≥30)的年龄标准化估计百分比”(NCD_BMI_30A)在非洲国家间的国家级观察数据,时间跨度为1990年至2022年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Prevalence of obesity among adults, BMI ≥ 30 (age-standardized estimate) (%)" (`NCD_BMI_30A`) across African nations, spanning 1990–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球健康观察站(WHO GHO)的OData API,针对非洲地区成人肥胖患病率(BMI≥30,年龄标准化估计百分比)这一关键健康指标进行系统整理。数据涵盖1990年至2022年间47个非洲国家的年度观测值,共计4653条记录。原始数据经过规范化处理,统一以Parquet文件格式存储,并采用一致的数据模式。所有数值均取自浮点数精度的`NumericValue`字段,而非显示字符串,同时保留了置信区间上下限(`value_low`与`value_high`)以增强统计可靠性。数据集由Electric Sheep Africa团队重新打包,作为面向机器学习的非洲统一数据仓库的一部分。
特点
该数据集的核心特点在于其多维分层结构,允许按性别(如SEX_BTSX、SEX_FMLE、SEX_MLE)等维度进行细粒度分析。每个国家-年份组合可能对应多个子维度行,用户可通过`dim1`与`dim2`字段灵活筛选所需分层数据。数据集包含12个精心设计的字段,涵盖指示符代码、国家ISO3代码、WHO区域、观测年份、数值估计及其置信区间等关键信息。此外,`value_display`字段提供了格式化显示字符串,便于人类阅读。这种结构化设计使得数据集既适用于分类任务,也适用于回归分析,为非洲地区肥胖流行趋势的建模与预测提供了坚实基础。
使用方法
数据集的调用极为便捷,可通过HuggingFace的`datasets`库直接加载,一行代码即可获取训练数据并转换为Pandas DataFrame进行分析。用户可基于`dim1`字段过滤出仅包含两性(SEX_BTSX)或全国层面的观测值,以获取总体趋势。对于特定国家的时序分析,可按`country_iso3`字段筛选目标国家,并按年份排序,轻松绘制肥胖率随时间的变化曲线。该数据集还支持跨国家比较,通过组合不同ISO3代码与年份条件,可构建面板数据模型。建议在使用前检查`dim1`和`dim2`字段的空值情况,以确保分层策略的准确性。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2025年整理发布,源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据API,聚焦非洲47个国家1990至2022年间成人肥胖患病率(BMI≥30,年龄标准化估计)的纵向追踪。作为非洲大陆健康数据统一与机器学习适配的重要实践,它系统整合了性别分层与置信区间信息,填补了该区域肥胖流行病学研究中高质量、结构化时间序列数据的空白,为跨国家、跨年代的肥胖趋势比较与预测建模提供了坚实基础。
当前挑战
数据集面临的核心挑战包括:其一,非洲肥胖患病率的持续攀升与有限监测能力之间的矛盾,亟需利用该数据构建精准预测模型以指导公共卫生政策干预;其二,构建过程中需处理WHO API返回的异构数据格式(如分层维度、缺失置信区间),同时保证47国4663条记录的一致性与可复现性,这要求严谨的数据清洗与模式标准化流程。
常用场景
经典使用场景
在非洲公共卫生与流行病学研究中,该数据集为分析成人肥胖的时空演变规律提供了标准化的量化工具。研究者常利用其涵盖47个非洲国家、跨越1990至2022年的连续观测值,构建面板数据模型,以揭示肥胖患病率在国家间和性别间的分布差异。通过整合置信区间字段,可开展稳健的meta分析或贝叶斯推断,评估肥胖负担的不确定性。数据还支持对肥胖趋势进行亚组分析,例如按性别分层或城乡居住地类型划分,从而捕捉特定人群的健康风险模式。其结构化的表格格式使机器学习和统计建模工作流无缝衔接,成为非洲非传染性疾病监测与干预策略制定的基础数据源。
衍生相关工作
围绕该数据集衍生了多项重要的研究工作,形成了非洲肥胖流行病学与计算社会科学的交叉创新。经典工作包括利用时序分解方法识别非洲各国肥胖率的转折点与加速期,并与膳食结构变化、GDP增长等宏观变量建立关联。另有研究基于此数据进行空间自相关分析,揭示肥胖在非洲的地理集群效应及跨境传播特征。在机器学习领域,学者们将其作为回归任务的标准数据集,训练梯度提升机和神经网络模型来预测未观测年份或区域的肥胖患病率,并将预测不确定性纳入模型评估。这些衍生工作共同推动了非洲健康数据科学的发展,为后续整合多源健康指标构建综合疾病负担模型奠定了方法论基础。
数据集最近研究
最新研究方向
在全球公共卫生领域,肥胖问题已成为非传染性疾病防治的核心议题之一,尤其在非洲大陆,随着城市化与饮食结构的变迁,肥胖患病率正呈现快速攀升趋势。该数据集聚焦于1990至2022年间47个非洲国家成年人体重指数≥30的年龄标准化肥胖患病率,为深入剖析非洲地区肥胖流行的时间演变与地域差异提供了高粒度的统计基础。凭借标准化的多维度分层设计(涵盖性别、城乡等亚组),研究者可借助机器学习与时间序列分析模型,系统评估肥胖与社会经济、环境政策及健康干预措施间的关联,进而为WHO非洲区域制定精准的公共卫生策略与跨国家比较研究注入关键的数据动能,对完善全球非传染性疾病监测体系具有显著的前沿推动作用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务