five

electricsheepafrica/africa-who-prevalence-of-thinness-among-children-and-adolescents

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-prevalence-of-thinness-among-children-and-adolescents
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家儿童和青少年瘦弱患病率的观测数据,具体指标为BMI低于中位数2个标准差以下的儿童和青少年瘦弱患病率(粗略估计)(%),代码为NCD_BMI_MINUS2C。数据覆盖1990年至2022年,来源于世界卫生组织全球健康观察站(WHO GHO)的OData API,并以Parquet文件形式重新打包,确保模式一致性。所有数值均来自NumericValue字段(浮点精度),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator "Prevalence of thinness among children and adolescents, BMI < -2 standard deviations below the median (crude estimate) (%)" (`NCD_BMI_MINUS2C`) across African nations, spanning 1990–2022. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区儿童与青少年消瘦患病率(BMI低于中位数2个标准差)的粗估计值。数据以Parquet格式重新打包,保持了统一的数据模式。47个非洲国家1990至2022年间的年度观测被纳入其中,共包含13959条记录。所有数值均取自高精度浮点字段NumericValue,而非显示字符串,同时提供了置信区间上下限。数据集按照性别(如男女合计、男性、女性)等子维度进行分层,每个国家、年份与维度的组合构成独立行,用户可通过dim1和dim2字段筛选目标分层。
使用方法
该数据集通过HuggingFace Datasets库集成,以一行命令即可加载:调用load_dataset函数并指定仓库路径,返回的数据可直接通过to_pandas方法转换为Pandas DataFrame进行后续分析。典型使用场景包括筛选全体人口数据(如过滤dim1字段以_BTSX结尾或为空的行),以及按国家提取时间序列(如对country_iso3字段进行条件过滤并排序)。数据集中value_numeric列可作为机器学习的目标变量,value_low和value_high则用于不确定性量化,此外还可结合dim1和dim2字段进行亚组分析(如按性别或居住区域类型比较)。
背景与挑战
背景概述
儿童和青少年消瘦是非洲地区长期面临的重大公共卫生挑战,与营养不良、传染病负担及社会经济不平等密切相关。世界卫生组织(WHO)通过全球卫生观察站(GHO)持续监测该指标,但原始数据分散、格式不一,难以直接用于机器学习建模。为此,Electric Sheep Africa团队于2022年后系统整理了WHO GHO中47个非洲国家1990至2022年间按性别和地区分层的数据,创建了该数据集,旨在为非洲儿童消瘦问题的预测、归因分析和政策评估提供标准化、可复用的结构化数据资源。该数据集的发布填补了非洲地区高分辨率消瘦患病率时间序列数据的空白,对全球卫生数据科学和非洲健康可持续发展目标(SDGs)的量化监测具有重要推动作用。
当前挑战
该数据集所解决的领域核心挑战在于儿童消瘦患病率受多维度因素(如气候、冲突、粮食价格)影响,且非洲卫生统计系统薄弱,导致传统回归模型难以准确捕捉时空异质性和数据缺失模式。在构建过程中,主要面临以下挑战:首先,原始WHO OData接口中不同国家的观测频率、置信区间完整性不一,需设计鲁棒的数据清洗与质量标记策略;其次,性别和城乡分层维度(如SEX_BTSX与RURAL)的编码不统一,需通过标准化映射避免分析偏差;再者,部分国家特定年份数据完全缺失,需要利用统计方法填补以维持时间序列连续性,避免破坏模型训练的因果结构。
常用场景
经典使用场景
该数据集聚焦于非洲儿童与青少年中体重过轻(BMI低于中位数两个标准差)的患病率,涵盖1990至2022年间47个非洲国家的观测数据。其经典使用场景在于构建儿童营养不良的时空分布模型,通过统计分析或机器学习方法,揭示不同国家、性别及年份间的患病率变化规律。研究者可借助该数据集进行时间序列预测,评估卫生政策对营养不良趋势的干预效果,并为全球健康不平等问题提供量化依据。数据包含点估计值与置信区间,特别适合用于回归分析与分类任务的基准测试。
解决学术问题
该数据集直击非洲地区儿童营养健康领域的核心学术困境,即缺乏长期、跨国家且标准化的消瘦患病率数据。以往研究多依赖于零散调查,难以进行系统性的对比分析。该数据集提供了统一Schema的面板数据,使得学术研究能够突破地域局限,探索营养不良的时空动态、性别差异及其社会经济驱动因素。它推动了全球健康指标(GHO)数据的再利用,为验证BMI与死亡率关联、评估可持续发展目标(SDG 2.2)中的营养目标进展提供了关键数据基础,显著增强了公共卫生决策的证据力度。
实际应用
在实际应用中,本数据集成为非洲各国卫生部门与援助机构制定营养干预策略的基石。例如,通过分析该数据集识别出消瘦高发国家与高危年龄段,可指导人道主义组织定向投放补充营养餐,优化粮食安全项目的资源分配。此外,公共卫生机构可结合气候与灾害数据,建立早期预警模型,预测饥荒风险区域的儿童营养不良恶化趋势。对保险与医疗系统而言,这些数据还用于评估长期健康负担,并为儿童生存率的提升提供可量化的监测指标。
数据集最近研究
最新研究方向
该数据集聚焦于非洲儿童与青少年消瘦患病率的时序监测与空间异质性分析,是评估区域营养健康与可持续发展目标(SDG 2)进展的关键数据源。当前研究前沿包括构建分层贝叶斯模型以校正亚组(性别、居住地)估计偏差,以及利用该长时序面板数据(1990–2022年)结合全球营养转型理论,探究消瘦率与传染病负担、粮食安全政策的动态关联。尤其在新冠疫情后,该数据集被整合进非洲健康预警系统,用于量化疫情对儿童营养状况的间接冲击,并为WHO非洲区域办事处的精准干预策略提供机器学习驱动的风险分层依据,其开放许可(CC BY 4.0)和标准化Parquet格式极大促进了跨国家、跨机构的可重复性研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务