five

electricsheepafrica/africa-who-taxes-as-a-of-price-import-duties

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-taxes-as-a-of-price-import-duties
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2008年至2022年间关于进口关税占价格百分比(WHO GHO指标`R_Imp_duty`)的国家级观测数据。它是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory的OData API,并以Parquet文件的形式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator "Taxes as a % of price: import duties" (`R_Imp_duty`) across African nations, spanning 2008–2022. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的官方OData API,经Electric Sheep Africa项目团队系统化采集与整合而成。原始数据以Parquet格式存储,确保高效的压缩与读取性能,并采用一致的列式结构以适配机器学习工作流。所有数值均直接取自API中的浮点精度字段`NumericValue`,而非格式化显示字符串,同时保留可用的置信区间边界(`value_low`与`value_high`)。数据集聚焦于WHO非洲区域(AFR)的47个国家,时间跨度覆盖2008年至2022年,共计358条观测记录。当指标按性别、居住地区类型等维度进行分层时,每个国家、年份与维度的独特组合均生成为独立的行,可通过`dim1`与`dim2`列进行精细筛选或聚合分析。
使用方法
数据集通过HuggingFace Datasets库轻松加载,用户仅需一行代码`load_dataset("electricsheepafrica/africa-who-taxes-as-a-of-price-import-duties")`即可获取完整的训练集并转换为Pandas DataFrame进行后续分析。为聚焦于全国层面且涵盖两性的数据,可借助`df.get("dim1", "").str.endswith("_BTSX") | df.get("dim1", pd.Series()).isna()`进行筛选,以排除按性别或城乡等子维度划分的细分记录。针对特定国家的时序分析,则可通过`df[df["country_iso3"] == "KEN"].sort_values("year")`快速提取并排序肯尼亚的历年数据。该数据集适用于回归预测、分类建模以及时间序列分析等任务,其结构化的列设计使得基于国家、年份、产品类型的多维度探索变得直观高效。
背景与挑战
背景概述
全球烟草控制政策的经济学评估日益成为公共卫生研究的关键领域,其中进口关税作为税收政策工具,对烟草制品价格及消费行为的调节作用尤为突出。在此背景下,世界卫生组织(WHO)全球卫生观察站(GHO)于2022年发布了“非洲—WHO GHO:进口关税占价格百分比”数据集(指标代码R_Imp_duty),由Electric Sheep Africa团队重新整理并以HuggingFace平台发布。该数据集聚焦非洲47个国家2008至2022年间与烟草相关产品的进口关税数据,旨在为研究者提供标准化、机器学习友好的结构化数据,以探究税收政策对烟草消费及健康结局的影响。其系统化的多维细分维度(如烟草产品类型、性别、城乡)进一步拓展了政策评估的深度与广度,为非洲区域卫生经济建模与循证决策奠定了坚实的数据基础。
当前挑战
该数据集所应对的核心研究挑战在于量化非洲地区烟草进口关税作为价格构成部分的真实效应,以填补中低收入国家在税收-健康关联路径中的证据空白。传统二手数据常因报告口径不一致、置信区间缺失或维度过粗而难以用于计量分析,本数据集通过提供标准化数值字段与置信区间边界(value_low/value_high)部分缓解了此问题。然而,其构建过程中面临显著挑战:首先,原始WHO OData API中部分观察值存在缺失置信区间或结构不统一的问题,需依赖NumericValue而非展示字符串进行提取;其次,47个非洲国家在2008至2022年间仅有358条有效记录,时空稀疏性限制了面板数据分析的稳健性;最后,产品子维度(如电子烟液、加热烟草与无烟烟草)的异质性可能掩盖关税在不同品类间的差异性影响,需研究者在设计模型时谨慎处理多类别分层与归并策略。
常用场景
经典使用场景
该数据集聚焦于非洲地区烟草及尼古丁产品进口关税占其价格比重的跨国时间序列观测,涵盖2008年至2022年间47个非洲国家的358条记录。其典型应用在于构建面板数据回归模型,用以评估关税政策对烟草制品消费与公共健康的影响。研究者可借助该数据集,通过国家、年份与产品子类(如最畅销卷烟、电子烟液、加热烟草制品)的多维分层,解析不同尼古丁产品所受税收负担的异质性,为健康经济学领域的计量分析提供精准的量化基础。
解决学术问题
该数据集直接回应了非洲公共卫生研究中长期存在的税收政策量化难题。通过提供标准化的进口关税占价格比例指标,它使学术界能够系统分析关税作为价格杠杆在抑制烟草消费、降低吸烟率方面的实际效力。数据集包含置信区间估计,支持稳健性检验与不确定性量化,解决了以往因数据碎片化而难以开展跨国比较研究的痛点。其研究意义在于为世界卫生组织《烟草控制框架公约》中关于价格与税收措施的证据基础提供了来自非洲大陆的实证支撑。
实际应用
在实际应用层面,该数据集可作为非洲各国卫生部门与财政机构制定烟草税收政策的决策参考工具。政策制定者能够基于具体的关税占比数据,模拟调整进口税率对烟草零售价格的影响,进而预测消费行为变化与潜在税收收入。非政府组织与国际发展机构亦可利用该数据集追踪各国履约进展,评估烟草控制措施的实施效果,并在跨国政策对话中提供数据驱动的谈判依据。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家烟草及尼古丁产品的进口关税占价格百分比,成为全球健康经济学与税收政策交叉领域的前沿研究素材。当前研究方向集中于利用这一结构化时间序列数据,结合机器学习模型(如回归与分类任务),动态评估关税政策对烟草消费行为的抑制效应及其与公共卫生目标(如降低非传染性疾病负担)的协同关系。特别是,研究者通过分层维度(如城乡、性别)精细刻画关税差异对弱势群体的影响,为世界卫生组织《烟草控制框架公约》在非洲的落地提供数据驱动的政策优化依据。此外,该数据集的高频更新特性使其成为追踪非洲国家税收调整与跨境健康不平等演变的热点工具,显著推动了区域健康治理的循证决策进程。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务