electricsheepafrica/africa-who-tobacco-warning-w2a-cigarette-packaging-health-warnings
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-tobacco-warning-w2a-cigarette-packaging-health-warnings
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家关于WHO GHO指标烟草警告:W2a香烟包装健康警告及其他特征的国家级观察数据,时间跨度为2007年至2024年。数据集来源于WHO全球健康观察站OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Tobacco Warning: W2a cigarette packaging health warnings, other characteristics across African nations, spanning 2007–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区烟草包装健康警告的指标特征。原始数据经过系统性整合与清洗,以Parquet格式存储,并采用一致的列式结构。所有数值均取自高精度的NumericValue字段,同时辅以置信区间上下限。数据集仅保留WHO AFRO区域标识的非洲国家观测值,覆盖2007至2024年间34个国家的281条记录,最终由Electric Sheep Africa项目统一封装为可直接用于机器学习的库。
特点
该数据集的核心特色在于其结构严谨且具备多维解析能力。除了国家、年份和数值点估计等基础字段外,还包含WHO区域代码、指标代码、置信区间边界以及维1与维2的分层信息,可支持按性别、城乡居住地等亚组进行过滤或聚合分析。数据来源权威且更新及时,全部采用开放许可协议发布,为非洲烟草控制政策的量化研究提供了可靠且精细化的数据基底。
使用方法
研究者可通过HuggingFace的datasets库一键加载该数据集,使用load_dataset函数即可获取完整的训练集。返回的Parquet格式数据可直接转换为Pandas DataFrame进行后续分析。典型操作包括按国家筛选时间序列、过滤出全国性与两性合并的观测值,或根据dim1与dim2字段提取特定亚组数据。数据集列名清晰,便于与其它GHO指标数据表进行关联与联合建模。
背景与挑战
背景概述
烟草使用是全球可预防死亡的首要原因之一,非洲大陆因烟草流行趋势加剧而面临严峻的公共卫生挑战。在此背景下,世界卫生组织全球卫生观察站(WHO GHO)自2007年起系统追踪各国烟草控制政策的实施进展。该数据集由WHO维护并由Electric Sheep Africa团队重新打包,聚焦于非洲地区34个国家在2007至2024年间关于香烟包装健康警告及其他特征的指标(TOBACCO_MPOWER_W2A_CIGARETTES)。核心研究问题在于评估非洲各国烟草包装警示政策的执行强度与合规水平,为循证控烟决策提供量化依据。该数据集填补了非洲区域烟草政策高分辨率、机器可读数据的空白,对全球控烟监测和区域健康不平等研究具有重要的推动价值。
当前挑战
该数据集所应对的领域挑战在于烟草包装健康警告作为MPOWER控烟策略的关键组成部分,其有效性的评估长期受限于数据分散、标准不一与时间跨度不足,尤其在非洲低收入国家中,政策执行与监测数据极为匮乏。构建过程中的主要挑战包括:从WHO OData API中提取并清洗多维度、多国家、长时间序列的稀疏数据,确保数值精度而非文本表述的一致性;处理因缺失或分层(如性别、城乡)导致的非平衡观测,281条记录需在统计可靠性与国家代表性间寻求平衡;以及将原生的异构展示格式转化为统一Parquet模式,纳入置信区间字段以支持后续不确定性量化分析。
常用场景
经典使用场景
该数据集聚焦于非洲地区香烟包装健康警告标识的合规性与实施特征分析,涵盖2007至2024年间34个非洲国家的面板数据。研究者可借此开展跨国比较分析,量化不同国家在包装警示文本、图形覆盖面积、警告位置等维度上的政策执行差异,并追踪其随时间演变的趋势。数据以标准化Parquet格式存储,便于与人口、经济或健康结局变量进行关联,从而揭示政策强度与吸烟行为、健康素养之间的潜在关联。
解决学术问题
在烟草控制研究中,该数据集填补了非洲地区包装警告政策量化数据的空白,解决了跨国家、长时序政策一致性评估的难题。学术领域可借此检验MPOWER框架中警告措施(W2a指标)的实施效果,分析其与吸烟率、戒烟意愿及肺癌发病率等健康终点的生态学关联。通过与WHO其他GHO指标联合建模,研究者能够控制社会经济混杂因素,更严谨地评估政策对公共卫生的净贡献,推动循证决策科学的进步。
衍生相关工作
该数据集已催生多类衍生研究,包括构建非洲烟草政策综合指数(整合W2a与MPOWER其余指标),以及开发时空贝叶斯模型预测警告措施对吸烟流行率的滞后效应。其与全球疾病负担数据(GBD)的链接推动了非洲吸烟所致伤残调整生命年(DALYs)归因分析。此外,Electric Sheep Africa系列中其他非洲健康指标数据集(如疫苗接种覆盖率)常与之一同分析,形成跨议题的多维政策评估框架。
以上内容由遇见数据集搜集并总结生成



