electricsheepafrica/africa-who-most-sold-brand-of-cigarettes-taxes-as-a-of-price-specific
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-most-sold-brand-of-cigarettes-taxes-as-a-of-price-specific
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了非洲国家在2008年至2020年间,世界卫生组织全球健康观察指标Most sold brand of cigarettes - taxes as a % of price - specific excise的国家级观察数据。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue字段,而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖了47个非洲国家,总行数为310行,区域筛选为WHO AFRO。
This dataset contains country-level observations for the WHO GHO indicator Most sold brand of cigarettes - taxes as a % of price - specific excise (R_Sp_excise_estimate) across African nations, spanning 2008–2020. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据接口,经由Electric Sheep Africa团队重新整合打包而成。数据聚焦于非洲地区最畅销香烟品牌中特定消费税占价格的百分比(指标代码R_Sp_excise_estimate),覆盖2008至2020年间47个非洲国家的观测记录。所有数值均提取自OData API中的NumericValue字段,并保留浮点精度,同时纳入置信区间上下限参数。数据以Parquet格式存储,采用统一的schema结构,确保了机器学习就绪的规范性与高效性。
使用方法
数据集可通过HuggingFace Datasets库便捷加载,调用load_dataset函数后即可获取训练集。推荐利用Pandas进行数据处理:通过过滤dim1字段中后缀为_BTSX或缺失值的行,可提取全国范围的两性汇总数据;针对特定国家的时间序列分析,则可按country_iso3筛选并按year排序。此外,数据集已预留value_low与value_high字段,便于进行不确定性量化或置信区间可视化,增强了模型验证的严谨性。
背景与挑战
背景概述
烟草消费税作为遏制烟草消费、减轻公共卫生负担的核心政策工具,其量化评估对全球健康治理至关重要。该数据集源于世界卫生组织全球健康观测站,由Electric Sheep Africa团队于2020年前后整理并发布,聚焦非洲47国2008至2020年间最畅销卷烟品牌中特定消费税占价格的百分比。核心研究问题在于揭示非洲地区烟草税收政策的实际执行强度及其时空演变规律,为循证政策制定提供标准化、机器可读的底层数据支撑。数据集覆盖310条观测记录,包含置信区间等精细字段,填补了非洲区域高分辨率税收指标数据的空白,对全球健康经济学、税收政策比较及机器学习驱动的预测建模具有显著推动作用。
当前挑战
该数据集的构建与使用面临多重挑战。领域层面,烟草消费税数据涉及复杂的政策定义和跨国比较,不同国家对“最畅销品牌”及“特定消费税”的界定存在差异,可能影响指标的统一性和可比性;同时,税收对烟草消费行为的因果效应常与收入水平、执法力度等混淆因素交织,增加了模型推断的难度。构建过程中,原始数据分散于WHO OData接口,需跨年份、跨国家整合并统一模式,且部分观测缺少置信区间,导致不确定性量化受限;此外,非洲地区数据报告的不连续性及缺失值问题突出,310条记录中潜在的选择偏倚可能制约下游分析结果的稳健性。
常用场景
经典使用场景
在公共卫生与烟草政策研究领域,该数据集被广泛用于分析非洲各国特定消费税占香烟价格比例的时空分布特征。研究者可结合年份与国家代码,追踪2008至2020年间该指标的变化趋势,从而评估不同国家烟草税制改革的实施效果与动态演进。
解决学术问题
该数据集有效解决了非洲地区烟草税制量化研究中的数据匮乏问题,为探索税收政策与烟草消费行为之间的因果关系提供了可靠依据。通过该数据,学者得以检验特定消费税比例对吸烟率的抑制效应,并揭示区域间的政策差异对公共健康影响的异质性,进而为优化控烟策略提供实证支持。
实际应用
在实际应用中,该数据可服务于国际卫生组织及各国卫生部门开展烟草税政策的效果评估与跨境比较。政策制定者能够基于此数据集识别税收调节能力薄弱的国家,并设计针对性的税制改革方案,最终推动非洲地区烟草税负的合理化与控烟目标的实现。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家最畅销香烟品牌中特定消费税占价格比重的动态演变,为全球公共卫生政策与烟草控制领域提供了关键数据支撑。当前前沿研究方向旨在利用该数据集构建机器学习模型,预测非洲各国税收政策对烟草消费行为的非线性影响,并探索其与WHO《烟草控制框架公约》实施成效的关联。结合近年来非洲地区烟草税政策调整的热点事件,该数据集被用于量化分析特定消费税对降低吸烟率、减少烟草消费不平等的实际贡献,尤其关注低收入群体及性别维度下的差异性。其意义在于弥补了非洲大陆高分辨率烟草税收数据的空白,为政策制定者提供基于证据的优化工具,推动区域性烟草税改革以遏制烟草相关疾病负担。
以上内容由遇见数据集搜集并总结生成



