electricsheepafrica/africa-who-prevalence-of-underweight-among-adults-ncdbmi18c
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-prevalence-of-underweight-among-adults-ncdbmi18c
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(GHO)指标成年人BMI低于18的体重不足患病率(粗估计)百分比(NCD_BMI_18C)在非洲国家的国家级观察数据,时间跨度为1990年至2022年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO GHO OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Prevalence of underweight among adults, BMI < 18 (crude estimate) (%) (NCD_BMI_18C) across African nations, spanning 1990–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区成年人低体重患病率(BMI < 18,粗估计百分比)这一关键健康指标。数据经系统性采集与清洗后,以Parquet格式重新封装,确保架构一致性。所有观测值均提取自浮点精度的数值字段,并附带了置信区间上下限,从而为后续科学分析奠定了坚实的数据基础。数据集涵盖1990年至2022年间47个非洲国家的4653条观测记录,每条记录均包含国家代码、年份、数值估计及性别等分层维度信息。
特点
该数据集的核心特色在于其结构的严谨性与分析友好性。一方面,它提供了多维度分层信息,例如性别(男女及两性合并)或居住地类型,使得研究者能够针对特定亚群进行深入探究。另一方面,数据集不仅包含点估计值,还纳入了置信区间,极大提升了统计推断的可靠性。此外,一致的Schema设计与整洁的字段命名,使得数据易于集成至机器学习流程,尤其适合构建时序预测或区域对比模型。
使用方法
使用该数据集极为便捷,推荐借助HuggingFace的datasets库进行加载,一句代码即可将数据转换为Pandas DataFrame格式以便后续分析。对于需要聚焦国家层面或特定性别的分析场景,可通过过滤`dim1`字段中的`_BTSX`后缀或排除空值来获取两性合并的全国数据。同时,按`country_iso3`和`year`字段排序即可轻松提取任意国家的时间序列,用于趋势建模或健康政策评估。
背景与挑战
背景概述
该数据集源自世界卫生组织全球卫生观察站(WHO GHO),聚焦于非洲成年人低体重患病率(BMI < 18)的粗估计值,时间跨度覆盖1990年至2022年,涵盖47个非洲国家,共计4653条观测记录。由Electric Sheep Africa团队整理并重新打包为机器学习友好的Parquet格式,旨在为非洲健康领域的研究提供标准化、可复现的数据基础。作为非传染性疾病风险监测的关键指标,该数据集对评估营养不良负担、指导公共卫生政策以及推动非洲地区健康平等具有重要影响。
当前挑战
该数据集所解决的领域问题在于,非洲地区长期面临营养不良与超重并存的双重负担,但缺乏精细化的时空分布数据来支撑精准干预。构建过程中的挑战包括:原始WHO API数据存在格式不一致、缺失置信区间边界值等问题;不同国家数据上报频次与质量参差不齐导致时间序列不完整;需处理性别、居住区域等多维分层数据,确保聚合与分析时的统计一致性。此外,跨国家比较需克服人口基数与调查方法差异,以避免估计偏差。
常用场景
经典使用场景
该数据集聚焦于非洲地区成年人低体重患病率的时空演变,以BMI < 18的粗略估计值为核心指标,覆盖1990年至2022年间47个非洲国家的4653条观测记录。其经典应用场景体现在追踪区域营养健康状况的长期变迁,研究人员可借助时间序列分析揭示非洲各国低体重问题的改善或恶化趋势,也可通过性别分层(SEX_BTSX、SEX_FMLE、SEX_MLE)探索不同人群间的差异性模式,为公共卫生政策的制定提供实证基础。
实际应用
在实际应用层面,该数据集被广泛用于构建非洲营养风险的预测模型和早期预警系统,例如结合气候、经济等协变量预测低体重率的变化趋势,辅助世界卫生组织及非洲国家卫生部优化粮食援助与营养干预资源的空间配置。它还支持医疗健康领域的个性化风险评估工具开发,通过性别和区域亚组的精细分析,为针对孕妇、儿童等脆弱群体的精准健康计划提供数据驱动的支撑。
衍生相关工作
围绕该数据集衍生出一系列具有影响力的研究工作,包括利用机器学习模型对非洲低体重率进行时空插值与趋势预测,探索其在气候变化与粮食安全交互框架下的归因分析。相关经典工作还涉及将低体重数据与其他健康指标(如肥胖率、发育迟缓率)融合,构建多维度营养转型指数,以及开发可交互的非洲健康数据可视化平台,促进开放科学和跨学科协作的范式演进。
以上内容由遇见数据集搜集并总结生成



