five

electricsheepafrica/africa-who-see-nutsevwastingprev

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-see-nutsevwastingprev
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家WHO GHO指标see NUTSEVWASTINGPREV(sevwast5)的国家级观察数据,时间跨度为1993年至2019年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据仓库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了41个非洲国家,总共有2,462行数据,并按照WHO AFRO区域进行过滤。

This dataset contains country-level observations for the WHO GHO indicator see NUTSEVWASTINGPREV (sevwast5) across African nations, spanning 1993–2019. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 41 African nations with a total of 2,462 rows, filtered by WHO AFRO region.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区营养严重消瘦患病率(指标代码sevwast5)的监测数据。数据经过系统化清洗与整合,以Parquet格式存储,并采用统一的字段结构。所有数值均取自原始API中的浮点精度字段NumericValue,同时保留了置信区间的上下界。构建过程中,所有记录均限定为WHO非洲区域(ParentLocationCode = 'AFR')的国家级观测,确保了地域聚焦的精准性。
特点
数据集覆盖1993至2019年间41个非洲国家的2462条观测记录,时间跨度与地域广度兼具。其显著特点在于多维分层结构,包含年龄组、教育水平、居住地类型、性别及财富五分位等子维度。当指标按性别或年龄组等维度分层时,每个国家−年份−维度的唯一组合均生成独立行,这种设计既便于细粒度分析,又支持跨维度聚合,为流行病学建模提供了丰富的数据层次。
使用方法
通过HuggingFace的datasets库即可便捷加载数据,调用from datasets import load_dataset后,以load_dataset('electricsheepafrica/africa-who-see-nutsevwastingprev')即可获取。用户可通过to_pandas()方法转换为DataFrame进行常规分析。如需聚焦双边性别且全国层面的数据,可通过筛选dim1字段以_BTSX结尾或为空的行实现。对于特定国家的时间序列分析,则可利用country_iso3列(如'KEN'代表肯尼亚)结合year列排序获取。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于近年整理发布,源自世界卫生组织全球卫生观察站(WHO GHO),聚焦于非洲地区儿童严重消瘦患病率(sevwast5)这一关键营养健康指标。核心研究问题在于揭示非洲大陆儿童营养不良的时空分布特征及其与社会经济、地理等分层因素的关联。数据集覆盖1993至2019年间41个非洲国家的2462条观测记录,并包含年龄组、教育水平、居住地类型、性别及财富五分位等多维分层信息,为区域公共卫生研究与机器学习建模提供了标准化、高可用的数据基础。作为首个面向非洲卫生领域的统合性ML-ready数据集,它在全球健康不平等研究、营养干预政策评估及预测建模中具有重要的基准价值。
当前挑战
在领域问题层面,该数据集所解决的儿童严重消瘦患病率预测面临多重挑战:不同国家间卫生统计体系与数据采集标准差异显著,导致跨区域可比性受限;营养指标受气候、冲突、粮食价格等多因素交织影响,传统回归模型难以捕捉非线性与时空交互效应;分层后的子样本存在稀疏性,尤其针对少数国家或特定亚群时,数据缺失与置信区间较宽的问题突出。在构建过程中,挑战主要体现在异构数据源(WHO GHO OData API)的清洗与对齐、当指标存在多重分层(如同时按性别与财富五等分)时生成一致且无冗余的表格形态、以及保证时空维度下的数据完整性——所有挑战均指向为机器学习社区提供可信赖的预测目标与稳健的置信区间。
常用场景
经典使用场景
该数据集聚焦于非洲地区儿童严重消瘦患病率的监测,收录了1993至2019年间41个非洲国家的官方统计数据。在公共卫生与营养学研究中,它被广泛用于构建基于年龄、性别、居住地类型、教育水平及财富五分位等多维度的预测模型,以量化不同亚群中儿童营养不良的严重程度。研究者常将其作为监督学习的回归或分类任务的基础,如预测特定年份和区域内儿童消瘦患病率的点估计值,或评估其置信区间。其结构化且层次分明的数据特性,使其成为分析非洲儿童营养状况时空演变规律的经典资源。
解决学术问题
该数据集的核心价值在于为量化非洲儿童严重消瘦负担及其决定因素提供了标准化的数据基础。它有效解决了学术研究中长期存在的跨国家、跨时段营养不良指标难以统一比较的难题,使得研究者能够系统评估经济发展、农业政策、卫生干预等宏观因素对儿童营养状况的影响。通过支持分层分析和置信区间估计,该数据集帮助学术界区分统计噪声与真实趋势,从而更可靠地识别营养不良的热点区域和高危人群,为验证营养经济学、发展经济学及全球健康领域的关键假说提供了实证支撑,推动了相关理论模型的修正与完善。
衍生相关工作
该数据集衍生了多项具有影响力的相关研究。例如,学者们基于此数据开发了针对非洲儿童营养状况的机器学习预测模型,用以识别驱动消瘦患病率变化的关键社会经济和环境变量。另一些工作则利用其多维分层特征,探讨了性别不平等和母亲教育水平对儿童营养的代际传递效应。此外,该数据集被整合进更广泛的非洲健康指标综合数据库中,催生了涵盖多指标联合分析的区域性健康评估报告,深化了对非洲公共卫生转型进程中营养问题与其他健康挑战(如疟疾、艾滋病)交互作用的理解,并为跨学科合作提供了数据桥梁。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作