five

electricsheepafrica/africa-who-tobacco-raise-taxes-national-taxes-for-tobacco-and-nicotine

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-tobacco-raise-taxes-national-taxes-for-tobacco-and-nicotine
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家关于世界卫生组织全球健康观察指标烟草提高税收:烟草和尼古丁产品的国家税收(TOBACCO_MPOWER_R_TAX)的国家级观察数据,时间跨度为2008年至2024年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO全球健康观察OData API,并以Parquet文件形式重新打包,具有一致的架构。所有数值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator Tobacco Raise taxes: National taxes for tobacco and nicotine products (TOBACCO_MPOWER_R_TAX) across African nations, spanning 2008–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区烟草及尼古丁产品国家税收这一关键健康指标(代码TOBACCO_MPOWER_R_TAX)。数据集由Electric Sheep Africa团队统一整理,以Parquet文件格式重新封装,并采用一致的列结构。原始数据中的NumericValue字段被精确提取为浮点数点估计值,同时保留了可用的置信区间上下界。数据覆盖2008年至2024年间47个非洲国家的2899条观测记录。
使用方法
用户可通过HuggingFace Datasets库的load_dataset函数一键加载该数据集,并轻松转换为Pandas DataFrame进行分析。推荐的典型操作包括:过滤出全国层面且涵盖两性(BTSX)的数据,以消除分层干扰;按国家代码(如KEN)和时间列进行排序,构建特定国家的时间序列。该数据集特别适合用于预测税收政策与控烟效果之间的关系,或作为非洲区域健康经济学研究的基准数据源。
背景与挑战
背景概述
烟草税作为控烟政策的核心工具,其调节效能源于价格弹性机制,通过提高消费成本抑制烟草需求。世界卫生组织(WHO)《烟草控制框架公约》第6条明确要求缔约国实施税收措施减少烟草消费,但非洲地区因数据碎片化与税收透明度不足,长期缺乏系统性的跨国税收比较研究。为此,WHO全球卫生观察站(GHO)于2024年联合Electric Sheep Africa项目发布了涵盖47个非洲国家的烟草税数据集,聚焦国家层面的烟草与尼古丁产品税收指标,包含从价税、从量税、增值税等七类子维度。该数据集以Parquet格式统一重构,覆盖2008至2024年间的2899条观测值,并纳入置信区间等元数据,为机器学习驱动的非洲控烟政策评估提供了标准化、机器可读的高质量数据基础。其发布填补了非洲大陆烟草经济研究中跨时空比较的数据空白,有力推动了基于证据的税收政策优化与国际公共卫生合作。
当前挑战
该数据集面临的挑战首先源于领域问题的复杂性:非洲各国烟草税制差异显著,从价税与从量税结构的混合性、免税配额及非法贸易的存在,使得单纯依赖税收百分比指标难以精准刻画实际税负对消费行为的影响,需结合动态价格弹性与灰色市场规模进行多变量建模。在数据构建过程中,挑战尤为突出:部分国家(如南苏丹、利比里亚)的税收数据存在多年缺失或仅以模糊区间形式上报,WHO原始API中的数值字段(NumericValue)虽经清洗,但剩余缺失值仍需通过时空插值或分层贝叶斯方法估算。此外,亚组维度(如城乡、性别)的稀疏性导致跨层次聚合时引入偏差,而不同年份税收定义调整引发的时序不连续性,进一步增加了纵向分析的难度。注释规则的不统一与非标准化结构(如单元值范围标注混用)也提升了自动化特征工程的门槛。
常用场景
经典使用场景
在全球公共卫生与烟草控制领域,该数据集作为WHO全球卫生观察站(GHO)的核心指标之一,被广泛用于分析非洲各国烟草及尼古丁产品的国家税收水平及其变化趋势。研究者可依托其涵盖2008至2024年间47个非洲国家的近三千条观测记录,通过国家、年份及税收子维度(如从价税、从量税、增值税等)的多重筛选,构建时间序列或面板数据模型,从而精准评估不同税收政策对烟草消费的调控效果。该数据集的标准化架构和Parquet格式使其能够无缝对接机器学习流水线,为量化税收与健康产出之间的复杂关联提供了可靠的数据基础。
解决学术问题
该数据集首要解决了非洲地区烟草税收数据碎片化与不可比性的学术困境,为跨国比较研究和政策评估提供了统一、清洁且可复现的数据源。其设计兼顾了多种税收类型的分层信息,使得研究者能够深入探讨税种结构对烟草可负担性和消费行为的差异化影响,进而验证MPOWER框架中税收措施的有效性。此外,数据集附带的置信区间字段使得不确定性量化成为可能,为因果推断和统计建模提供了更严谨的支撑,推动了烟草经济学和全球健康政策交叉领域的实证研究进展。
实际应用
在实际应用中,该数据集为非洲各国卫生部门及国际组织(如WHO、世界银行)制定和优化烟草税政策提供了数据驱动的决策支持。通过分析税收水平与吸烟率的动态关系,政策制定者能够识别出当前税率在抑制烟草消费方面的潜在不足,并据此调整征税结构,尤其是在从价税与从量税的组合设计上。同时,数据还可用于监测MPOWER政策在非洲大陆的实施进展,帮助识别执行滞后或效果欠佳的国家,为定向技术援助和资源分配提供依据,从而助力实现降低非传染性疾病负担的全球目标。
数据集最近研究
最新研究方向
在全球公共卫生治理与烟草控制议程加速推进的背景下,该数据集聚焦于非洲地区烟草与尼古丁产品的国家税收政策,为探究税收工具在降低烟草消费、遏制非传染性疾病蔓延中的效能提供了关键数据支撑。当前研究前沿集中于利用该数据结合机器学习模型,分析不同税种结构(如从量税、从价税及增值税)对烟草可负担性的差异化影响,并关联WHO MPOWER框架中的税收措施执行效果。该数据集通过覆盖47个非洲国家、横跨2008至2024年的时间序列,揭示了税收政策在资源有限地区的实施动态,尤其与近期非洲多国为提高烟草税以响应《世卫组织烟草控制框架公约》的热点事件紧密呼应。其影响在于为精准建模税收与吸烟率、健康结局间的因果关系奠定基础,推动基于证据的政策优化,对减轻非洲日益沉重的烟草相关疾病负担具有深远意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务