five

electricsheepafrica/africa-who-alcohol-47archived

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-alcohol-47archived
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“15岁以上人均酒精消费量(以纯酒精升计),三年平均值及95%置信区间”(SA_0000001747_ARCHIVED)在非洲国家的国家级观察数据,时间跨度为2010年至2017年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据仓库。数据直接从WHO全球健康观察站OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,包含置信区间上下限(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Alcohol, recorded per capita (15+) consumption (in litres of pure alcohol), three-year average with 95%CI" (`SA_0000001747_ARCHIVED`) across African nations, spanning 2010–2017. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家2010至2017年间人均纯酒精消费量的三年移动均值及其95%置信区间的官方统计指标。原始数据经由系统化的ETL流程被提取、转换并加载为具有统一模式的一致性Parquet文件格式,所有数值均直接取自高精度的`NumericValue`字段,而非格式化后的字符串。数据集的核心架构包含国家代码、年份、点估计值、置信区间上下限及分层变量等关键字段,每一行记录均对应特定国家与年份下特定维度组合的观测值。
使用方法
用户可通过HuggingFace `datasets`库中的`load_dataset`函数直接加载该数据集,并便捷地转换为pandas DataFrame以进行后续分析。代码示例清晰展示了如何筛选性别为“两者”的全国层面数据,以及如何针对特定国家(如肯尼亚)按年份排序提取时间序列。这意味着用户能够快速开展人均酒精消费量的趋势分析、区域比较或作为健康结局预测模型的特征输入,极大降低了处理原始WHO API数据所需的工程复杂度。
背景与挑战
背景概述
酒精消费作为全球疾病负担的关键风险因素,长期以来受到世界卫生组织(WHO)的高度关注。由WHO全球健康观察站(GHO)维护的该数据集,聚焦于非洲地区15岁及以上人群的人均纯酒精消费量,以三年滑动平均形式呈现并附有95%置信区间。数据涵盖2010至2017年间46个非洲国家,共138条观测记录,由Electric Sheep Africa团队整理并发布,旨在为非洲健康领域研究提供机器学习就绪的标准化数据资源。作为WHO官方数据的重要衍生成果,该数据集弥补了非洲地区酒精消费高精度时空数据的空白,为跨国家比较、流行病学建模及政策评估提供了关键支撑,在公共卫生、社会经济学及数据科学交叉领域具有显著影响力。
当前挑战
该数据集所解决的领域问题在于:非洲地区酒精消费数据长期存在稀疏性、异质性与可重复性不足的挑战,传统统计方法难以有效支持区域级趋势分析与机器学习建模。具体而言,数据来自多国年度报告,不同时期统计口径与归档版本(如ARCHIVE_DEC2019)可能引入偏差;置信区间数据部分缺失,影响不确定性量化;且样本量仅138条,对高维特征提取与泛化能力构成严苛限制。构建过程中,团队需处理WHO OData API的异构接口、统一多国编码体系、解析维度分层(如性别与居住地域)并保留数值精度而非显示字符串,同时在CC BY 4.0许可下保障数据溯源与引用规范性,这些均对工程化清洗与元数据一致性提出较高要求。
常用场景
经典使用场景
该数据集聚焦于非洲国家15岁及以上人群人均纯酒精消费量的三年移动平均值及其95%置信区间,涵盖2010至2017年间46个非洲国家的面板数据。其经典使用场景在于构建跨国家、跨时段的酒精消费趋势分析模型,通过整合WHO全球卫生观察站的官方统计数据,为研究非洲大陆酒精消费模式的时间演化与空间分布提供了标准化的量化基础。研究者可借助该数据集开展面板数据回归、时间序列预测以及多层统计分析,从而揭示经济发展、城市化进程与酒精消费之间的潜在关联。
解决学术问题
在学术研究层面,该数据集有效填补了非洲地区酒精消费高精度量化数据的空白,解决了长期以来因数据零散、口径不一致导致的区域比较分析困难。它使得学者能够系统性地探讨酒精消费水平与公共卫生指标之间的关系,如肝硬化发病率、交通事故死亡率以及心血管疾病负担等。此外,数据集内含的置信区间信息支持更严谨的不确定性量化分析,提升了因果推断和风险评估的可靠性,对于全球健康经济学、流行病学以及政策评估领域具有重要的方法论意义。
实际应用
实际应用上,该数据集可直接服务于世界卫生组织及各国卫生部门的政策制定与效果评估。公共卫生机构可利用这些数据监测区域酒精消费趋势,识别高风险人群与地区,从而优化酒精税、销售限制及健康教育等干预策略。对于非政府组织和国际发展机构而言,该数据集是开展非洲健康项目影响评估的宝贵基线资源,有助于设计针对性的减害措施并追踪其长期成效。此外,数据以机器可读的Parquet格式分发,兼容主流数据科学工具,便于嵌入自动化监控系统。
数据集最近研究
最新研究方向
当前,africa-who-alcohol-47archived数据集在非洲公共卫生与流行病学交叉领域掀起研究热潮,尤其聚焦于酒精消费对非传染性疾病负担的动态影响。结合世界卫生组织全球健康观察站(GHO)的权威数据,该数据集为探究2010至2017年间46个非洲国家人均纯酒精摄入量(15岁以上人群)的时空演变提供了标准化、机器学习友好的基础资源。前沿研究方向紧密关联全球酒精政策热点,如世界卫生组织《减少有害使用酒精全球战略》的实施效果评估,以及《2030年可持续发展议程》中健康目标监测。研究者利用其包含置信区间的连续变量与亚组维度(如性别、城乡分异),构建预测模型以揭示社会经济因素(如城镇化、GDP)与饮酒模式的非线性关联,或通过时空插值填补因调查缺失导致的偏倚。该数据集的发布填补了非洲区域纵向酒精消费数据的空白,不仅助力验证基于替代数据源(如酒精销售统计)的估算方法,还为低资源国家设定酒精税、广告禁令等干预措施的优先级提供了证据链,深刻推动了数据驱动型全球健康治理范式的演进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作