electricsheepafrica/africa-who-alcohol-0000001688
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-alcohol-0000001688
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标15岁以上人均酒精消费量(以纯酒精升计)(SDG指标3.5.2),三年平均值(SA_0000001688)在非洲国家的国家级观测数据,时间跨度为2000年至2022年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory的OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Alcohol, total per capita (15+) consumption (in litres of pure alcohol) (SDG Indicator 3.5.2), three-year average (SA_0000001688) across African nations, spanning 2000–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区15岁及以上人群人均酒精消费量(以纯酒精升数计,对应SDG指标3.5.2)的三年移动平均值。数据采集覆盖2000年至2022年间47个非洲国家,共1081条观测记录。构建过程中,所有数值均直接取自API返回的浮点精度字段NumericValue,而非格式化显示字符串,并保留了置信区间上下界(value_low与value_high)等关键信息。数据以Parquet格式存储,并纳入Electric Sheep Africa统一数据集集合,遵循一致的列式模式设计,确保机器学习场景下的即用性。
使用方法
该数据集通过HuggingFace Datasets库可直接加载,仅需一行代码即可获得Pandas DataFrame格式的训练数据。使用时建议优先过滤dim1字段中以_BTSX结尾或为空的行,以获取两性合并的国家层面观测值,避免因性别分层带来的重复计数。若需构建时间序列分析,可依据country_iso3列筛选特定国家,并利用year字段排序。对于回归或分类任务,value_numeric列可作为核心目标变量,而置信区间范围可辅助构建概率模型或误差度量。数据集中未出现缺失值时可直接投入训练,若需处理分层结构,则应按研究问题合理聚合或选择特定子维度。
背景与挑战
背景概述
酒精消费是影响全球公共卫生的重要风险因素,世界卫生组织(WHO)将人均纯酒精消费量列为可持续发展目标(SDG)指标3.5.2,以监测有害饮酒行为。该数据集由Electric Sheep Africa与WHO全球卫生观察站合作创建,截至2022年,收录了2000年至2022年间47个非洲国家的年度观测数据,共计1081条记录。其核心研究问题在于揭示非洲地区15岁以上人群人均纯酒精消费量的时空分布特征,为公共卫生政策制定与跨区域比较提供结构化、机器学习友好的数据支撑。作为专注于非洲数据的开放资源,该数据集通过统一模式整合原始WHO数据,有力推动了非洲区域酒精消费相关议题的量化分析与干预研究。
当前挑战
该数据集所解决的领域问题主要包括:酒精消费数据的高度异质性(如不同国家定义与统计口径差异)、时空覆盖不完整以及多层分组变量(如性别、城乡)带来的分析复杂性。在构建过程中面临的核心挑战有:清洗WHO OData API原始接口中的文本型数值字段并提取浮点精度值,确保NumericValue字段准确性;处理置信区间缺失情况时需平衡信息完整性与数据结构一致性;区域过滤(AFRO)可能遗漏部分边缘国家,影响跨洲比较;此外,数据集的较小规模(约1000条)与稀疏年份分布对模型泛化能力构成了显著制约。
常用场景
经典使用场景
该数据集以世界卫生组织全球卫生观察站为数据源,聚焦非洲47个国家2000年至2022年间15岁及以上人口人均纯酒精消费量(以升计),并基于三年移动平均处理以平滑年度波动。其经典使用场景集中于跨国面板数据分析,研究者可借助该数据集构建回归模型,探讨酒精消费与经济发展水平、城市化进程、文化习俗及政策干预之间的关联,或将其作为健康指标纳入可持续发展目标(SDG 3.5.2)监测体系,评估非洲区域在减少有害酒精使用方面的进展。
解决学术问题
该数据集为学术研究提供了标准化、机器可读的非洲酒精消费面板数据,有效解决了此前数据分散、格式不一、缺乏纵向覆盖的难题。研究者可借此深入剖析酒精消费对非洲人群非传染性疾病负担(如肝硬化、心血管疾病及精神障碍)的归因风险,量化酒精消费与交通事故、暴力犯罪等社会问题的关联,并评估税收调整、广告禁令等政策工具的实际效果。其核心意义在于填补了非洲大陆酒精流行病学领域高质量时间序列数据的空白,为循证公共卫生决策提供了坚实的数据基石。
实际应用
在实际应用中,该数据集可作为非洲各国卫生部门制定国家酒精控制策略的参考基准,助力识别高消费风险区域并优化资源配置。国际组织如世界卫生组织及非洲疾病预防控制中心可依托此数据开展跨区域对比,监测各国实现可持续发展目标3.5的进展。此外,公共卫生倡导团体可利用数据趋势设计针对性的社区干预项目,而酒精饮料行业则能据此评估市场饱和度与消费模式变化,推动企业社会责任项目的精准落地。
数据集最近研究
最新研究方向
在当前全球公共卫生治理与可持续发展议程交织的背景下,非洲大陆的酒精消费研究正成为跨学科前沿的焦点。该数据集基于世界卫生组织全球健康观察站提供的SDG指标3.5.2(15岁及以上人群人均纯酒精消费量三年平均值),系统覆盖了2000至2022年间47个非洲国家的时序观测数据,为机器学习驱动的健康政策建模提供了标准化的高质量素材。其核心价值在于,研究者可借助该数据集深入探索酒精消费与区域经济发展、非传染性疾病负担及营养不良等复杂社会生态因素的动态关联,并结合WHO非洲区域独特的文化规范与政策干预历史,构建预测性因果模型。该数据集对验证『酒精税与管控政策在低收入环境中的有效性』、『城镇化与消费模式迁移』等热点议题具有不可替代的支撑作用,为推动基于证据的公共卫生决策与可持续发展目标本土化监测提供了坚实的计算社会科学研究基底。
以上内容由遇见数据集搜集并总结生成



