five

electricsheepafrica/africa-who-alcohol-0000001747

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-alcohol-0000001747
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标15岁以上人均酒精消费量(以纯酒精升计),三年平均值(SA_0000001747)在非洲国家的国家级观测数据,时间跨度为2000年至2022年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Alcohol, recorded per capita (15+) consumption (in litres of pure alcohol), three-year average (SA_0000001747) across African nations, spanning 2000–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
本数据集源于世界卫生组织全球卫生观察站(WHO GHO)的OData应用程序编程接口,经由Electric Sheep Africa团队进行系统化整理与再封装,形成面向机器学习场景的标准化数据资源。数据收集聚焦于非洲地区15岁及以上人口的人均纯酒精消费量(以升为单位),并以三年移动平均值的形式呈现,覆盖了2000年至2022年间46个非洲国家的1058条观测记录。在构建过程中,所有数值均采用高精度的浮点字段(NumericValue),而非显示字符串,同时完整保留了可获取的置信区间上下限数据,最终以统一的Parquet文件格式存储,确保了数据的一致性与可复现性。
使用方法
使用者可通过HuggingFace的datasets库便捷加载该数据集,推荐使用load_dataset('electricsheepafrica/africa-who-alcohol-0000001747')指令,并利用to_pandas()方法将数据转化为DataFrame进行后续操作。为获取国家层面的总消费数据,建议通过筛选维1字段中以'_BTSX'结尾的条目或缺失值来排除亚组分层;若需专注于特定国家的时间序列分析,则可依据country_iso3字段进行过滤,并辅以year字段排序。对于缺失的置信区间数据,应妥善处理空值,以确保建模过程的稳健性。
背景与挑战
背景概述
酒精消费作为全球公共卫生领域的关键风险因素,与多种非传染性疾病及社会负担密切相关。世界卫生组织(WHO)通过全球卫生观察站(GHO)长期监测各国人均酒精消费量,以期指导政策制定。在此背景下,Electric Sheep Africa团队于2024年整理发布了africa-who-alcohol-0000001747数据集,聚焦非洲大陆46个国家2000至2022年间15岁以上人群的年均纯酒精消费量(升)。该数据集以三次平均值为指标,由WHO官方OData接口清洗、标准化后生成,共含1058条记录,适用于表格分类与回归任务。其规范化架构与置信区间字段的保留,显著提升了非洲健康数据的机器学习可用性,为跨区域酒精消费模式分析及公共卫生干预效果评估提供了高质量数据基础。
当前挑战
该数据集所应对的核心挑战在于酒精消费对非洲公共卫生造成的复杂影响,如何准确衡量并预测区域消费趋势以支持干预策略制定。同时,数据构建面临诸多困难:首先,WHO原始数据来源于各国分散的自报告或销售统计,存在报告标准不一与时间滞后性;其次,非洲部分国家数据稀疏,导致46国间的覆盖率差异较大,早期年份(如2000年初)的缺失值增多;此外,指标按性别、居住地等维度细分后,部分国家年度的子类别数据极为有限,信度区间字段也仅在部分观测中提供,影响了模型训练的鲁棒性与地域泛化能力。
常用场景
经典使用场景
该数据集来源于世界卫生组织全球健康观察站,聚焦非洲国家15岁以上人群人均纯酒精消费量的三年移动平均值,覆盖2000年至2022年间的46个非洲国家,共计1058条观测记录。作为结构化的表格数据,它既可用于回归任务以预测酒精消费量,亦可进行分类分析以识别高消费与低消费国家。研究者可通过国家、年份等维度灵活筛选数据,构建时间序列模型或跨截面比较,是探索非洲大陆酒精消费趋势与健康政策效果的宝贵资源。
解决学术问题
在学术界,该数据集的核心价值在于支撑酒精消费与社会经济发展、公共卫生政策之间关系的实证研究。它有助于揭示非洲地区酒精摄入量的时空演化规律,评估全球酒精控制策略在区域层面的成效。通过与其它健康指标(如肝病发病率、交通事故率等)的关联分析,研究者可验证酒精消费对公共健康的潜在影响,为世界卫生组织及各国政府制定科学干预措施提供数据支撑,推动循证决策的深化。
实际应用
在实践层面,该数据集为公共卫生机构、政策研究智库及国际组织提供了精准的区域健康监控工具。例如,各国卫生部可据此对比本国酒精消费水平与区域均值,识别高风险人群并调整资源分配。国际非政府组织可利用该数据集评估减害项目的长期效果,优化宣传教育与税收调节策略。此外,数据科学家可将该数据集融入非洲健康数据平台,助力机器学习模型在低资源环境下预测疾病负担,提升决策效率。
数据集最近研究
最新研究方向
该数据集聚焦于非洲大陆15岁以上人群的人均酒精消费量(纯酒精升数,三年滑动平均),为健康经济学与流行病学研究提供了关键的时间序列基础。在全球非传染性疾病(NCDs)防控议题持续升温的背景下,非洲作为酒精消费增长最快的地区之一,其消费模式的量化分析对制定区域性卫生政策具有不可替代的支撑作用。本数据集结合WHO全球卫生观测站(GHO)的权威指标,经过标准化清洗与Parquet格式重构,能高效支持机器学习的回归与分类任务,有助于研究者探索酒精摄入与社会经济、疾病负担之间的动态关联。尤其在可持续发展目标(SDG 3.5)强化酒精滥用预防的议程下,该数据的发布为跨国家、跨年份的纵向比较与预警建模提供了坚实的数据基座。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作