electricsheepafrica/africa-who-mean-bmi-ncdbmimean
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-mean-bmi-ncdbmimean
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家1975-2016年间WHO GHO指标平均BMI(kg/m²)(年龄标准化估计)的国家级观测数据。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。所有数值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集涵盖了46个非洲国家,共5,796行数据,并提供了详细的模式描述和使用示例。
This dataset contains country-level observations for the WHO GHO indicator "Mean BMI (kg/m²) (age-standardized estimate)" (`NCD_BMI_MEAN`) across African nations, spanning 1975–2016. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,针对非洲地区年龄标准化后的平均身体质量指数(BMI,单位kg/m²)这一关键健康指标进行系统整合。数据覆盖1975年至2016年间46个非洲国家的国家级观测值,总计5796条记录。原始数据经由WHO GHO的OData API获取后,被重新封装为统一模式的Parquet文件格式,确保机器学习任务的直接可用性。每条记录包含点估计值(value_numeric),并尽可能附带置信区间上下限(value_low、value_high),同时保留维度信息如性别(SEX)分层,以适应多维度分析需求。
使用方法
使用者可通过HuggingFace的datasets库便捷加载数据,仅需一行代码即可获取完整的训练集。例如,调用load_dataset('electricsheepafrica/africa-who-mean-bmi-ncdbmimean')即可将数据载入为DataFrame格式。针对特定分析需求,可通过筛选dim1字段(如以'_BTSX'结尾的值为两性合并数据)来聚焦于国家级整体趋势;或按国家维度(如country_iso3 == 'KEN')提取肯尼亚的时间序列数据,并结合年份排序进行趋势分析。该数据集的标准化模式使其能无缝集成至机器学习管道中,作为回归任务的标签或分类任务的特征变量。
背景与挑战
背景概述
肥胖及其相关非传染性疾病已成为全球公共卫生领域的重大挑战,尤其在非洲地区,伴随城市化与生活方式变迁,体质指数(BMI)的长期监测对于制定有效的干预政策至关重要。在此背景下,世界卫生组织(WHO)基于全球卫生观察站(GHO)数据,整理了涵盖1975年至2016年间46个非洲国家的年龄标准化平均BMI指标数据集(NCD_BMI_MEAN),由Electric Sheep Africa团队于HuggingFace平台重新分发,以机器学习就绪的格式提供。该数据集聚焦于非洲大陆,旨在弥合区域健康数据缺口,为流行病学研究、健康政策评估及预测模型构建提供统一、可复用的基础资源,对推动非洲非传染性疾病负担的量化分析具有显著影响力。
当前挑战
该数据集所解决的领域问题核心在于非洲地区长期缺乏一致、高质量且可机读的BMI面板数据,传统上数据分散于不同国家报告且时间跨度不一,难以进行跨国的系统性趋势分析与机器学习建模。构建过程中面临的挑战包括:需要从WHO OData API中提取并清洗原始指标,处理因性别、居住地类型等分层维度导致的复杂结构,确保每一国家-年份组合的唯一性;同时需整合并保留置信区间等统计信息以支持不确定性量化,并协调不同来源的时间戳与编码标准,最终形成规范化的Parquet格式,以降低研究者使用门槛,促进非洲健康数据的科学挖掘。
常用场景
经典使用场景
该数据集聚焦于非洲国家1975至2016年间年龄标准化后的平均体重指数(BMI)估计值,是研究非洲大陆人口营养状况与代谢健康演变趋势的核心资源。在非传染性疾病流行病学领域,它被广泛用于构建时间序列模型,以揭示不同性别、城乡及国家层面的BMI长期变化轨迹。研究者通常将其作为因变量,探索经济发展、城市化进程或膳食结构转型对体重指数的影响,从而为区域健康政策制定提供量化依据。
解决学术问题
该数据集有效解决了非洲地区长期缺乏系统性、标准化人体测量学数据的学术困境。通过提供跨46个国家、覆盖42年的年龄标准化BMI估计值,它使得研究者能够克服以往数据零散且口径不一的障碍,开展了大规模的非传染性疾病风险因素时空分析。这一数据集合推动了关于非洲肥胖悖论、营养转型阶段划分以及性别差异在代谢健康中作用等关键学术问题的实证研究,显著深化了对该大陆健康转型动态的认知。
实际应用
在实际应用中,该数据集为世界卫生组织及各国公共卫生机构监测和评估营养相关非传染性疾病负担提供了关键输入。政府决策者利用其追踪国家肥胖率变化,制定针对性的膳食指南和身体活动促进计划。发展机构则以此为依据,识别营养干预的优先国家与高危险人群,并评估健康促进项目的长期效果。此外,该数据也被整合进全球疾病负担研究中,用于拟合区域模型和预测未来代谢疾病流行趋势,具有重要的政策指导价值。
数据集最近研究
最新研究方向
基于世界卫生组织全球卫生观测站数据,非洲地区年龄标准化平均BMI数据集(1975-2016年)正成为非传染性疾病流行病学前沿研究的重要基石。当前研究焦点集中于利用该数据集构建时空预测模型,揭示非洲大陆肥胖与营养不良双重负担的演变轨迹,并结合社会经济、环境及粮食系统变量,探究BMI变化背后的结构性驱动因素。随着人工智能与公共卫生的深度融合,该数据集被广泛用于训练机器学习模型以预测未来BMI趋势,为政策制定者提供循证干预策略,其标准化的多国、多年份时间序列属性尤为珍贵,有力推动了非洲地区健康指标监测的数字化与智能化进程。
以上内容由遇见数据集搜集并总结生成



