five

electricsheepafrica/africa-who-alcohol-0000001403

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-alcohol-0000001403
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家WHO GHO指标Alcohol, total (recorded 3 year average + unrecorded) per capita (15+) consumption (in litres of pure alcohol)(SA_0000001403)的国家级观测数据,时间跨度为2005年至2010年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。

This dataset contains country-level observations for the WHO GHO indicator Alcohol, total (recorded 3 year average + unrecorded) per capita (15+) consumption (in litres of pure alcohol) (SA_0000001403) across African nations, spanning 2005–2010. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,聚焦于非洲地区15岁及以上人群人均纯酒精消费量(含记录与未记录部分,以三年平均值计)。数据经过系统化抽取与标准化处理,以Parquet格式存储于HuggingFace平台,属于Electric Sheep Africa系列项目。其构建严格遵循WHO原始指标代码SA_0000001403,提取了浮点精度字段NumericValue作为核心数值,同时保留了置信区间上下界值。覆盖2005至2010年间46个非洲国家的184条观测记录,并依据性别等维度进行分层,确保统计口径一致性与可复用性。
使用方法
该数据集的使用极为简洁高效,用户可通过HuggingFace的datasets库直接加载为Dataset对象,并一键转换为Pandas DataFrame进行深入分析。建议过滤dim1字段以获取特定性别或居住地类型的数据,例如通过字符串结尾筛选获取两性全体的国家层面记录。也可按年份排序,对单个国家如肯尼亚绘制时序变化趋势。由于其尺寸较小(不足1000行),适合快速实验、教学演示或作为回归与分类任务的基准数据集,无需复杂预处理即可投入模型训练或可视化探索。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观察站(GHO)创建,由Electric Sheep Africa团队统一整理并发布于HuggingFace平台,聚焦于非洲地区15岁以上人群的酒精总消费量(含记录和未记录的三年均值,以纯酒精升数计),时间跨度为2005年至2010年,涵盖46个非洲国家共计184条观测记录。作为非洲健康数据体系的一部分,该数据集以机器学习友好格式提供,旨在为区域酒精消费模式、公共卫生政策制定及跨国家比较研究提供标准化、可复用的数据基础,对理解非洲大陆酒精相关健康负担的分布与趋势具有重要参考价值。
当前挑战
该数据集所解决的领域问题在于系统量化非洲地区酒精消费水平,以应对该区域长期存在的酒精消费数据缺失、统计口径不一及跨国可比性差的挑战,为酒精相关的疾病负担评估与干预政策提供依据。在构建过程中,主要挑战包括:从WHO OData API中提取精确的浮点数值而非字符串显示值,确保数据精度;对按性别(SEX)等维度分层的数据进行归一化处理,避免重复或混淆的观测记录;以及处理置信区间字段的缺失值问题,以维护数据集的完整性与分析可靠性。
常用场景
经典使用场景
该数据集聚焦于非洲各国15岁以上人群人均纯酒精消费量(涵盖三年记录均值与未记录部分),时间跨度为2005至2010年,覆盖46个非洲国家。其经典使用场景在于作为面板数据结构,支撑跨国家、跨年份的酒精消费水平比较与趋势分析。研究者可借助性别分层维度(如男性、女性、两性合计)解剖消费差异,或结合国家层面的社会经济、公共卫生指标开展多变量回归建模,从而揭示非洲大陆酒精消费模式的时空演变规律。
解决学术问题
该数据集解决了非洲区域酒精消费量化数据长期碎片化、可比性不足的学术困境。通过统一收纳WHO全球卫生观察站的标准化指标,它使得研究者能够对非洲各国的人均酒精消费量进行系统性统计推断,填补了低资源地区酒精流行病学数据库的空白。其完整收录的置信区间信息为不确定性量化提供了可能,支持酒精消费与肝硬化、交通事故、暴力犯罪等健康及社会负效应之间的因果关联验证,为公共卫生政策的循证制定奠定了数据基石。
实际应用
在实际应用层面,该数据集是国际组织、国家卫生部门及非政府机构进行酒精相关健康风险监测与干预评估的核心工具。公共卫生官员可据此研判不同非洲国家的酒精消费水平是否达到有害阈值,并据此调配健康教育、税收调节或销售管控等干预资源。此外,数据还可嵌入全球疾病负担测算模型的输入环节,辅助世界卫生组织更新非洲区域酒精使用障碍的患病率估算,乃至驱动各国对可持续发展目标中减少有害饮酒进度进行实证追踪。
数据集最近研究
最新研究方向
非洲地区酒精消费与公共健康交叉研究正迎来数据驱动的新范式。该数据集聚焦WHO全球健康观察站指标SA_0000001403,系统收录了2005至2010年间46个非洲国家针对15岁以上人群的人均纯酒精消费量(含记录与未记录部分),并提供了按性别细分的数据维度与置信区间,为机器学习驱动的区域流行病学建模奠定了坚实基础。当前,受全球酒精消费对非传染性疾病影响的持续关注,结合非洲大陆独特的酒精消费文化与社会经济背景,该数据集正被用于探究酒精摄入与肝病、心血管疾病等健康结局的量化关联,以及评估减害政策效果。其高时空分辨率与标准化Schema设计,使得跨国家时间序列分析、性别差异挖掘及风险预测模型的开发成为可能,为非洲公共卫生决策提供了可复用的数据基础设施,也推动了发展中国家健康大数据在AI时代的规范化应用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务