five

electricsheepafrica/africa-who-inflation-adjusted-prices-for-most-sold-brand-of-cigarettes-edpriceppp

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-inflation-adjusted-prices-for-most-sold-brand-of-cigarettes-edpriceppp
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家2008年至2022年间关于WHO GHO指标经通货膨胀调整的最畅销品牌香烟价格:以购买力平价计算,并根据美国平均消费者价格的逐年变化进行调整(R_afford_inflation_adjusted_price_ppp)的国家级观测数据。数据直接来源于WHO Global Health Observatory OData API,并被重新打包为Parquet格式文件,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator "Inflation-adjusted prices for most sold brand of cigarettes: Prices in purchasing power parity adjusted by year on year changes in average consumer prices in the United States of America" (`R_afford_inflation_adjusted_price_ppp`) across African nations, spanning 2008–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织(WHO)全球卫生观察站(GHO)的OData API,聚焦于非洲地区最畅销卷烟品牌经通胀调整后的价格,以购买力平价(PPP)为基准,并依据美国年均消费价格变动进行逐年校准。数据以Parquet格式封装,确保机器学习就绪的标准化模式。构建过程中,严格提取浮点精度的NumericValue作为核心观测值,而非显示字符串,同时保留可用的置信区间上下界,覆盖2008年至2022年间46个非洲国家的346条记录,所有数据均遵循CC BY 4.0许可协议。
特点
该数据集的核心特征在于其提供了跨时间与空间的卷烟价格可负担性量化指标,通过通货膨胀调整与购买力平价转换,实现不同经济体间的横向与纵向可比性。数据包含丰富的字段,如国家ISO代码、年份、数值估计及置信区间,并支持性别、居住地类型等维度分层,便于精细化分析。作为Electric Sheep Africa系列的一部分,它整合了非洲数据资源,专为机器学习任务(分类与回归)优化,且规模精炼(n<1K),适合快速建模与验证。
使用方法
数据集可通过Hugging Face Datasets库便捷加载,使用`load_dataset`函数即可获取训练集,并转换为Pandas DataFrame进行后续处理。典型应用包括对国家层面进行性别和居住地区过滤,例如筛选两性总计(BTSX)或缺失的分层数据,以获取全国性时间序列,或按国家代码(如KEN)提取特定国家的纵向趋势。此外,用户可利用置信区间字段评估数据质量,或直接以`value_numeric`作为回归目标,结合机器学习和统计模型开展烟草经济与公共卫生政策的关联研究。
背景与挑战
背景概述
烟草消费是全球公共卫生领域面临的重大挑战之一,尤其在非洲大陆,由于经济发展不均衡和烟草监管政策差异,烟草制品的可负担性成为衡量公共卫生干预效果的关键指标。该数据集由世界卫生组织全球卫生观察站(WHO GHO)于2022年发布,并由Electric Sheep Africa团队重新整理封装,聚焦于非洲46个国家最畅销香烟品牌在2008至2022年间的通胀调整价格,并以购买力平价(PPP)为基准进行标准化处理。核心研究问题在于揭示非洲各国烟草制品真实价格水平及其变动趋势,为制定有效的烟草税收政策和控烟措施提供量化依据。这一数据集的构建填补了非洲区域烟草价格标准化数据的空白,对于评估《世界卫生组织烟草控制框架公约》在非洲的实施效果具有重要推动作用。
当前挑战
该数据集所解决的领域核心挑战在于,烟草价格在不同国家和年份间因通货膨胀、汇率波动及购买力差异而难以直接比较,导致公共卫生政策制定缺乏可靠依据。通过引入通胀调整和购买力平价换算,数据集有效统一了价格度量标准,使跨国纵向分析成为可能。在构建过程中,主要挑战包括:数据来源分散于WHO GHO的多维度接口,需通过OData API抓取并进行一致性清洗;原始数据中部分观测值缺失置信区间,需处理缺失值以维持统计完整性;此外,46个非洲国家在2008至2022年间,因政治动荡或统计能力不足,部分年份数据存在稀疏性,需通过合理的插值或分类聚合策略来保证数据集在机器学习和回归任务中的可用性。
常用场景
经典使用场景
该数据集的核心应用在于追踪非洲各国最畅销香烟品牌经通胀调整后的购买力平价价格,为烟草经济学研究提供了横跨2008至2022年的跨国面板数据。研究者可利用这一资源构建时间序列模型,剖析价格变动与烟草消费行为之间的动态关联,尤其适合开展价格弹性分析,量化烟草税负提升对抑制吸烟率的效果。数据涵盖46个非洲国家,使区域比较与宏观政策模拟成为可能。
解决学术问题
数据集有效填补了非洲地区烟草价格长期标准化观测数据的空白,使学者得以解决关于烟草可负担性评估中跨国可比性不足的问题。通过纳入购买力平价调整与美国年均消费价格变动校正,数据为区分真实价格变化与货币购买力波动提供了方法论基础,进而支撑了针对烟草控价政策有效性的因果推断研究,助力揭示价格干预在降低烟草消费中的边际贡献。
衍生相关工作
围绕该数据集衍生出的一系列经典工作包括构建非洲烟草可负担性指数,用于动态监测各国烟草价格相对居民收入的漂移趋势;同时,研究者将其与全球疾病负担数据结合,评估价格变化引发的吸烟相关疾病经济负担转移。此外,部分工作利用该数据训练回归模型,预测不同税收方案下烟草消费的长期变化轨迹,为卫生经济仿真提供关键输入参数。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务