electricsheepafrica/africa-who-taxes-as-a-of-price-other-taxes
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-taxes-as-a-of-price-other-taxes
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2008年至2022年期间的世界卫生组织全球健康观察指标Taxes as a % of price: other taxes(R_tax_other)的国家级观察数据。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Taxes as a % of price: other taxes (R_tax_other) across African nations, spanning 2008–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家中“其他税收占价格百分比”(R_tax_other)这一指标。数据以Parquet格式重新封装,采用统一的模式结构,确保机器学习就绪。所有数值均取自高精度的浮点型字段NumericValue,而非显示字符串,同时保留了置信区间上下限。数据集覆盖2008至2022年间47个非洲国家,共计359条观测记录,并依据WHO AFRO区域进行筛选。当指标存在分层(如按性别或年龄组)时,每个国家、年份与维度的独特组合生成独立行,用户可通过dim1/dim2字段筛选特定层级。
使用方法
使用该数据集时,推荐采用HuggingFace的datasets库进行加载,通过load_dataset函数直接获取训练集并转换为Pandas DataFrame以进行后续分析。对于全国性、两性共有的数据,可依据dim1字段中BTSX后缀或空值进行筛选。若需分析特定国家的趋势,可按country_iso3列过滤并排序年份。数据中的value_numeric字段可作为机器学习的主要目标变量,而value_low和value_high则用于不确定性评估。此外,用户可通过dim1和dim2字段实现分层分析,或聚合不同维度的数据以获取全局视角。
背景与挑战
背景概述
烟草消费税作为公共卫生干预的重要工具,其结构设计直接影响控烟政策的有效性。世界卫生组织(WHO)全球健康观察站于2022年发布的“税收占价格百分比:其他税费”数据集(指标代码R_tax_other),由Electric Sheep Africa团队整理并托管于HuggingFace平台,聚焦2008至2022年间47个非洲国家的纵向数据。该数据集的核心研究问题在于量化其他税费(区别于烟草专项消费税)在卷烟、电子烟液、加热烟草及无烟烟草产品最终价格中的占比,为评估非洲地区烟草税收政策的统一性与公平性提供基准。作为WHO GHO体系的关键补充,数据集揭示了非洲大陆在烟草税制设计上的异质性,助力计量经济学模型探讨税收结构对烟草消费行为、政府财政收入及健康结果的影响,已在国际卫生政策比较研究中形成独特参考价值。
当前挑战
该数据集所解决的领域核心挑战在于,税收占比指标中存在多种税费的混同效应——其他税费与专项消费税在价格中的相对比例如何影响烟草可负担性及社会健康公平性,这要求模型能分离不同税种的政策效果以辅助精准干预。构建过程中则面临多重技术挑战:数据来源仅涵盖WHO AFRO辖区47国,缺失部分国家某些年份记录导致样本量仅359条,且置信区间字段部分缺失;指标按烟草产品类型、性别、城乡区域等多维度分层(dim1/dim2),不同层的观测独立性难以保证;此外,原始API返回的NumericValue需与显示字符串严格对应,跨年度同一指标定义可能随WHO编码规则调整而隐含不一致性,需通过规范化流程消除数据漂移风险。
常用场景
经典使用场景
该数据集记录了2008至2022年间47个非洲国家在烟草及其他尼古丁产品价格中‘其他税收’所占的百分比,是研究非洲地区烟草税制结构的关键数据源。经典使用场景包括构建时间序列模型以追踪税收占比的动态演变,或通过分类与回归任务预测不同国家、不同产品类别(如最畅销卷烟、电子烟液、加热烟草制品)的税收负担。研究者常利用其分层维度(如性别、城乡)进行亚组分析,以揭示税收政策对不同人群的差异化影响。
解决学术问题
数据集填补了非洲区域烟草税细节指标的系统性空白,解决了跨国比较中税收数据口径不一致、时间跨度短等传统难题。它使学者能够量化‘其他税收’在总价格中的权重,从而评估其对控烟效果的实际贡献,并检验税收组合(从量税、从价税与其他附加费)的政策协同性。这一指标对理解非洲各国财政与公共卫生目标的平衡关系具有里程碑意义,为全球减税与健康促进的交叉研究提供了可靠的基础依据。
实际应用
在实际应用中,该数据集支持卫生部门与政策制定者进行跨国税制对标,例如识别哪些国家在非健康目的税收上占比过高,从而调整税种结构以提升烟草产品的税负有效性。国际组织(如世界银行、WHO)可借助其分析非洲地区烟草非法贸易的税收驱动因素,并模拟不同税收方案对消费行为的影响。此外,数据也为非政府组织在倡导控烟政策时提供量化证据,推动针对性的财税改革。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家烟草及其他尼古丁产品价格中其他税种占比的纵向追踪,为全球健康经济学与税收政策研究提供了关键数据支撑。近年来,随着世界卫生组织《烟草控制框架公约》在非洲的深入推行,围绕烟草税赋结构、替代尼古丁产品(如电子烟、加热烟草)的税收公平性及对公共卫生的影响成为前沿热点。该数据集通过覆盖47个非洲国家2008—2022年的高粒度指标,结合性别、城乡等人口学分层,使得研究者得以剖析不同税收工具对消费行为的调节效应,并评估其在减少烟草相关疾病负担与实现可持续发展目标中的实际效能,对推动非洲区域精准控烟策略与财税改革具有深远意义。
以上内容由遇见数据集搜集并总结生成



