electricsheepafrica/africa-who-inflation-adjusted-prices-for-most-sold-brand-of-cigarettes-edpricelcu
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-inflation-adjusted-prices-for-most-sold-brand-of-cigarettes-edpricelcu
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家2008年至2022年间,世界卫生组织全球健康观察站(WHO GHO)关于“经通货膨胀调整的最畅销品牌香烟价格:以本地货币计价的价格,根据各国平均消费者价格的年度变化进行调整”的指标数据(`R_afford_inflation_adjusted_price_lcu`)。数据来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据存储库。
This dataset contains country-level observations for the WHO GHO indicator "Inflation-adjusted prices for most sold brand of cigarettes: Price in local currency adjusted by year on year changes in average consumer prices in each country" (`R_afford_inflation_adjusted_price_lcu`) across African nations, spanning 2008–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球健康观察站(WHO GHO)的公开数据接口,聚焦于非洲地区最畅销品牌卷烟经通胀调整后的价格,以本地货币计量并依据各国年度平均消费者价格变动进行校正。原始数据经由Electric Sheep Africa项目统一抽取与重封装,以Parquet文件格式存储,确保机器学习就绪的标准化模式。数据值直接取自数值型字段'NumericValue',同时保留置信区间边界,共涵盖45个非洲国家自2008年至2022年的343条观测记录。
特点
数据集的核心特色在于其提供了非洲大陆多国间卷烟价格的可比性度量,通过通胀调整消除了货币购买力的时序差异。每个观测点均包含点估计与置信区间,支持对价格不确定性的量化评估。此外,数据集还融入了次维度分层信息,如性别与居住地类型,允许用户针对特定人群或区域进行精细分析,从而揭示价格在不同社会经济群体中的差异分布。
使用方法
用户可通过HuggingFace的'datasets'库便捷加载该数据集,将其转换为Pandas DataFrame后进行分析。典型用法包括筛选全国范围或特定性别群体的数据,例如通过'dim1'字段过滤出'BTSX'(两性合计)的观测值,或按国家代码与年份排序以构建单一国家的时间序列。数据集适用于回归或分类任务,可用于探究烟草价格可负担性与其他健康或经济指标间的关联。
背景与挑战
背景概述
烟草消费是全球公共卫生领域面临的重大挑战之一,尤其是在非洲地区,由于经济转型和收入水平差异,吸烟行为和相关健康负担日益受到关注。由世界卫生组织(WHO)全球卫生观察站(GHO)主导创建的这一数据集,聚焦于非洲国家2008年至2022年间最畅销品牌香烟的通胀调整后价格,以本地货币计值并通过逐年消费者价格指数变动校正。该数据集由Electric Sheep Africa团队整合并发布于HuggingFace平台,旨在为机器学习研究提供统一、可直接使用的结构化数据。其核心研究问题在于量化香烟可负担性随时间的变化趋势,进而评估价格政策在控烟干预中的有效性。作为一份覆盖45个非洲国家的标准化时间序列数据,该数据集为公共卫生经济学、健康政策分析及跨区域比较研究奠定了重要基础,对推动非洲控烟议程具有显著影响力。
当前挑战
该数据集面临的核心挑战之一是解决香烟可负担性这一复杂领域问题的度量困境。烟草价格受多重因素影响,包括通货膨胀、汇率波动、税收政策及市场结构差异,单纯的名义价格难以反映真实可负担性变化,而通胀调整后的价格虽能部分缓解此问题,却仍需应对不同国家消费者价格指数统计口径不一致的难题。在构建过程中,数据稀疏性与覆盖不均衡成为主要障碍,例如部分国家在早些年份缺乏完整观测值,导致时间序列存在缺口。此外,由于WHO指标可能按性别、城乡等维度进行分层,每一条观测记录对应不同亚组,这要求研究者谨慎处理聚合与筛选逻辑,以避免因维度偏差影响模型训练结果。同时,置信区间字段的缺失进一步增加了不确定性量化与预测稳健性评估的难度。
常用场景
经典使用场景
该数据集的核心应用场景在于剖析非洲各国最畅销卷烟品牌经通货膨胀调整后的实际价格演变轨迹。研究者可借助面板数据格式,系统考察2008至2022年间非洲45国的烟草定价动态,揭示价格水平与宏观经济波动、消费能力之间的内在关联。数据天然适用于时间序列分析、回归建模及分类任务,为评估烟草税收政策的有效性提供量化依据,是健康经济学与公共政策交叉领域的基础资源。
衍生相关工作
基于此数据集,衍生出多项关键研究脉络:一类聚焦于构建非洲烟草可负担性指数,结合居民收入数据刻画不同国家的价格承受力差异;另一类则发展出动态面板计量模型,将通胀调整价格与烟草广告禁令、公共场所无烟立法等政策变量交互分析。同时,该数据也激发了区域性预测工作,利用机器学习方法推演未来烟草消费趋势,并催生了面向政府决策者的交互式可视化工具,使复杂数据转化为直观的政策简报。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家最畅销卷烟品牌经通胀调整后的价格动态,为全球烟草控制政策与健康经济研究提供了关键数据支撑。前沿方向包括利用价格弹性模型评估税收政策对烟草消费的抑制作用,结合非洲各国通胀波动与可负担性指标,量化干预措施的公共卫生收益。该数据集与WHO《烟草控制框架公约》履约监测、世界银行减贫战略等热点事件紧密关联,其跨年份面板数据揭示了非洲烟草市场的定价异质性,为设计差异化烟草税制、评估消费者行为响应提供了实证基础,对推动非洲控烟实效与实现可持续发展目标3.4具有重要政策意义。
以上内容由遇见数据集搜集并总结生成



