electricsheepafrica/africa-who-prevalence-of-obesity-among-adults-ncdbmi30c
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-prevalence-of-obesity-among-adults-ncdbmi30c
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“成年人肥胖患病率,BMI≥30(粗略估计)(%)”在非洲国家的国家级观察数据,时间跨度为1990年至2022年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Prevalence of obesity among adults, BMI ≥ 30 (crude estimate) (%)" (`NCD_BMI_30C`) across African nations, spanning 1990–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,聚焦于非洲地区成年人肥胖患病率(BMI≥30,粗估计值)这一核心健康指标。研究者通过统一的数据抽取与清洗流程,将原始数据重新打包为Parquet格式文件,并遵循一致的列式存储结构。数据观测时间跨度为1990年至2022年,覆盖47个非洲国家,共计4653条记录。每个观测样本均包含点估计值及其上下置信区间(若可用),并依据WHO AFRO区域代码进行过滤,确保了数据的地域聚焦性与统计可靠性。
特点
数据集的核心特点在于其多维度的结构化设计。除了国家、年份及数值型核心指标外,还包含了性别(SEX)等分层维度,允许研究者针对不同子群体(如男、女、两性合计)进行精细化分析。数据以浮点数形式存储精确的数值估计,同时保留格式化显示字符串便于人工阅读。置信区间上下界的嵌入,赋予了模型或统计分析以不确定性度量的能力。整体数据规模适中,适用于时间序列分析、面板数据回归及跨国家比较研究。
使用方法
用户可通过HuggingFace的datasets库便捷加载该数据集,调用load_dataset函数即可获取训练集并转换为Pandas DataFrame。推荐的分析路径包括:通过筛选dim1字段中以_BTSX结尾或为空的值,提取全国两性合计的宏观趋势;亦可按country_iso3字段定位特定国家(如KEN),并按年份排序绘制纵向变化曲线。数据集适用于表格分类与回归任务,是研究非洲肥胖流行病学趋势、建立预测模型或进行公共卫生政策评估的理想基础数据资源。
背景与挑战
背景概述
肥胖作为全球性公共卫生危机,已被世界卫生组织列为非传染性疾病的主要风险因素之一,尤其在撒哈拉以南非洲地区,伴随营养转型与城市化进程,成人肥胖率呈现迅速攀升态势。在此背景下,世界卫生组织全球卫生观测站于2022年发布了“非洲成人肥胖患病率(BMI≥30,粗估计)”数据集,由Electric Sheep Africa团队整理并托管于HuggingFace平台。该数据集聚焦非洲47个国家1990至2022年的肥胖率观测值,涵盖4653条结构化记录,旨在为区域内肥胖问题的流行病学监测、政策制定及机器学习建模提供统一、可复用的基础数据,对推动非洲健康数据科学的发展具有里程碑意义。
当前挑战
该数据集所应对的核心领域挑战在于非洲大陆肥胖流行趋势的量化困境:由于医疗记录体系薄弱、调查标准不一,传统统计难以捕捉时空动态变化,亟需一种标准化的纵向数据来支持精准干预。构建过程中面临多重挑战,包括跨国度、跨年代的数据源整合——WHO GHO原始API接口存在多维度分层(如性别、地域类型)导致数据冗余,需设计一致的模式以滤除噪声;置信区间字段部分缺失,需处理不完全观测下的估计稳定性问题;此外,需将字符串格式的显示值转换为浮点数值以适用机器学习管线,数据处理链路的鲁棒性成为关键瓶颈。
常用场景
经典使用场景
在肥胖流行病学与全球健康监测领域,该数据集作为世界卫生组织全球健康观测站的核心指标,记录了1990至2022年间47个非洲国家成年人肥胖患病率的年度变化,并以性别分层和置信区间为重要维度。研究者可借此追踪肥胖负担的时空演变规律,尤其适合用于构建时间序列预测模型、识别肥胖高发国家及脆弱群体,或评估公共卫生干预政策对肥胖率的影响。该数据集以Parquet格式提供,具备结构化、机器学习就绪的特性,为跨区域肥胖趋势的比较分析提供了可靠的数据基础。
衍生相关工作
该数据集衍生出多项前沿研究与应用:包括利用长短期记忆网络(LSTM)等深度学习方法预测非洲各国肥胖率演变轨迹,以及结合卫星影像与人口统计数据构建肥胖地理空间风险模型。部分工作将其与糖尿病、高血压等合并症数据联合分析,揭示肥胖作为非传染性疾病共同风险因子的复杂网络。此外,数据集的标准化格式也启发了面向非洲地区的多模态健康数据仓库建设,促进了跨数据集联邦学习在精准公共卫生中的探索。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区成人肥胖患病率的长期趋势与空间分布,正成为全球健康不平等研究的前沿阵地。结合世界卫生组织全球健康观察站的数据,研究者可借助机器学习与时间序列分析,探究肥胖与其他非传染性疾病(如糖尿病、心血管疾病)的关联模式,并为非洲公共卫生政策制定者提供基于证据的干预靶点。尤其是在非洲城市化加速与膳食结构转型的背景下,该数据集支撑了关于代谢风险因素的社会决定因素研究,对实现联合国可持续发展目标中的健康福祉目标具有重要数据驱动意义。
以上内容由遇见数据集搜集并总结生成



