electricsheepafrica/africa-who-total-taxes-on-beverages
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-total-taxes-on-beverages
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2022年至2024年期间关于饮料总税率(%)的观测数据,数据来源于WHO Global Health Observatory。数据集是Electric Sheep Africa项目的一部分,该项目旨在提供一个统一的、适用于机器学习的非洲数据仓库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件格式重新打包。所有数值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了43个非洲国家,共221行数据,并提供了详细的列描述和使用示例。
This dataset contains country-level observations for the WHO GHO indicator "Total taxes on beverages (%)" (`TAXBEV_TOTALTAXES`) across African nations, spanning 2022–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球健康观察站,聚焦于非洲国家含酒精与无酒精饮料的税收比率,以指标代码TAXBEV_TOTALTAXES进行标识。数据于2022至2024年间采集,覆盖43个非洲国家,共221条观测记录。构建过程中,通过WHO OData API直接抓取原始数值,剔除显示字符串中的格式化信息,保留浮点精度的NumericValue作为核心指标。同时,将置信区间上下限、维度分层(如饮料类型、性别、居住区域)等结构化字段一并整合,最终以Parquet格式封装,形成架构统一、可直接用于机器学习的标准化数据集。
使用方法
使用该数据集时,推荐通过HuggingFace Datasets库直接加载,借助load_dataset函数读取Parquet格式文件,并利用to_pandas方法转换为DataFrame以供分析。为获取仅包含不分性别的全国层面数据,可针对dim1字段进行筛选,保留末尾为'_BTSX'或dim1为空值的行。对于特定国家的时间序列研究,可通过country_iso3字段定位目标国家,并按year字段排序。该数据集亦支持按BEVERAGETYPE维度进一步细分,以满足对于含酒精或非酒精饮料税收政策的专项分析需求。
背景与挑战
背景概述
在全球非传染性疾病防控体系中,含糖饮料与酒精饮料的消费已成为公共卫生政策的核心关注点。世界卫生组织(WHO)全球健康观测站于2022至2024年间,针对非洲区域43个国家系统收集了饮料总税率数据(TAXBEV_TOTALTAXES),涵盖酒精与非酒精两类饮品。该数据集由Electric Sheep Africa团队进行标准化整理并发布,旨在为机器学习驱动的区域税收政策效果评估提供结构化、可复用的基础资源。通过量化各国饮料税收负担的差异,该数据集为研究税收作为健康干预工具的有效性、揭示财政政策与消费行为之间的关联,以及推动非洲公共卫生决策的科学化转型提供了关键实证支持。
当前挑战
该数据集所应对的核心挑战在于,非洲各国对饮料产品的税收政策缺乏统一的量化监测框架,导致跨国比较与政策效果评估受限于数据碎片化与口径不一致。数据构建过程中亦面临显著困难:WHO原始ODA接口中的数值字段存在空值与置信区间缺失,需依赖NumericValue而非显示字符串进行精确提取;同时,指标按饮料类型(酒精/非酒精)及城乡、性别等维度分层,不同交叉组合下共221条记录中隐含稀疏性与结构异质性,对建模时的特征选择与缺失值处理提出了严苛要求。
常用场景
经典使用场景
该数据集收录了2022至2024年间非洲43个国家的含酒精与不含酒精饮料总税率观测值,涵盖点估计及置信区间。研究者可据此进行跨国家、跨年度的饮料税率比较分析,并借助'BEVERAGETYPE'等子维度开展分层统计建模。数据集以Parquet格式提供、与HuggingFace Datasets无缝衔接的特性,使其成为面向机器学习的标准表格数据,直接服务于分类与回归任务中的特征工程与模型训练。
解决学术问题
数据集旨在填补非洲地区饮料税收政策量化数据的空白,为公共卫生与经济学交叉领域提供基础性支撑。它使学者得以探究饮料税率与居民消费结构、肥胖率、非传染性疾病发病率之间的关联,并检验财政政策在引导健康行为中的媒介效应。通过整合置信区间信息,研究还能对估计量的不确定性进行正式建模,提升因果推断与政策仿真的统计稳健性。
实际应用
在实际应用中,该数据集可辅助世界卫生组织及各国卫生部门评估现有饮料税收政策的执行效果,为调整税率、优化税制设计提供数据依据。政策制定者可利用时间序列分析监测税率波动趋势,结合疾病负担数据制定糖税或酒精税调价方案。此外,非政府组织与健康倡导机构亦可借用该数据集的指标框架,开展区域间税收政策对比,并在倡导报告中嵌入可视化证据。
数据集最近研究
最新研究方向
在非洲公共健康政策领域,含糖饮料与酒精饮品的税收比例已成为干预非传染性疾病的关键杠杆。该数据集聚焦于2022至2024年间43个非洲国家的饮料总税率,为评估财税政策在遏制肥胖、糖尿病及酒精滥用等健康危机中的实际效力提供了量化基础。前沿研究正利用这一指标与消费数据、疾病负担进行关联分析,以构建政策影响模型,探讨税率调整如何重塑民众的饮品选择行为。尤其是在世界卫生组织倡导的“最佳性价比”干预措施框架下,该数据集的出现填补了非洲地区高分辨率税收数据的空白,使得跨国产出比较与时间序列分析成为可能,为各国制定循证税收策略、优化公共财政与健康收益的双赢路径注入了实证动能。
以上内容由遇见数据集搜集并总结生成



