electricsheepafrica/africa-who-tobacco-warning-w1a-cigarette-packaging-health-warnings
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-tobacco-warning-w1a-cigarette-packaging-health-warnings
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2007年至2024年期间,世界卫生组织全球健康观察站(WHO GHO)指标“烟草警告:W1a香烟包装健康警告”(TOBACCO_MPOWER_W1A_CIGARETTES)的国家级观察数据。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自浮点精度字段(NumericValue),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。
This dataset contains country-level observations for the WHO GHO indicator "Tobacco Warning: W1a cigarette packaging health warnings" (`TOBACCO_MPOWER_W1A_CIGARETTES`) across African nations, spanning 2007–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
在全球公共卫生治理的宏大叙事中,烟草包装健康警示作为控烟政策的关键一环,其监测数据对于评估政策效力具有不可替代的价值。本数据集源自世界卫生组织全球卫生观察站的OData应用程序编程接口,由Electric Sheep Africa项目精心整理并重新打包为具有统一模式的Parquet文件格式。数据聚焦于WHO GHO指标“烟草警告:W1a香烟包装健康警告”,覆盖2007至2024年间36个非洲国家的750条观测记录。所有数值均源自浮点精度字段NumericValue,并附带了置信区间上下限,确保了数据的精密性与分析的可靠性。
特点
作为面向非洲大陆的标准化机器学习数据集,其核心特质在于结构的严谨性与维度的丰富性。数据不仅包含国家、年份与数值估计值等核心字段,还引入dim1和dim2等分层维度,允许按性别、居住地类型等子维度进行精细筛选。此外,数据集中完整保留了置信区间字段,为不确定性量化提供了坚实支撑。其简洁的列式存储与统一的主键设计,极大降低了跨指标联合分析的门槛,是区域健康政策研究中不可多得的数据资产。
使用方法
研究人员可通过HuggingFace的datasets库以极简代码调取数据,轻松转换为Pandas数据框进行后续分析。针对特定研究需求,例如仅需全国层面且不分性别的观测,可依据dim1字段过滤出以_BTSX结尾或为空的行。对于时间序列分析,则可以对特定国家代码进行筛选并依年份排序。数据集的规范化结构使得与Electric Sheep Africa系列中其他WHO指标无缝衔接,构建出多维度的非洲健康数据面板,为机器学习建模与统计分析提供了流畅的数据管道。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2024年整理发布,源自世界卫生组织全球卫生观察站(WHO GHO)的公开数据,聚焦于非洲地区烟草警告标签政策实施状况,具体追踪2007至2024年间36个非洲国家在香烟包装上标注健康警告的合规情况。作为非洲卫生健康大数据统一化、机器学习就绪化倡议的一部分,该数据集旨在填补非洲大陆在烟草控制成效量化评估方面的数据空白,为流行病学研究、公共卫生政策分析及跨区域比较提供了标准化的结构化数据基础。其核心研究问题在于利用WHO MPOWER框架下的W1a指标,衡量非洲各国在烟草包装警示措施上的执行力度与演变趋势,对于全球减烟行动及区域健康治理具有重要的实证支撑价值。
当前挑战
该数据集所应对的领域挑战主要源于非洲地区烟草流行监测系统的薄弱与数据碎片化,各国在警告标签设计、覆盖范围及法律执行上的差异导致跨国可比性不足,且小样本容量(750条记录)限制了深层统计推断与稳健机器学习模型的训练。构建过程中的挑战则包括从WHO OData API中抽取并清洗非标准化的多维度数据(如分性别、居住地类型的分层变量),需要处理缺失的置信区间、冗余的显示字符串以及指标代码异构问题,同时需统一各国不同时间点的数据采集时效与更新频率,最终转化为以Parquet格式存储、具备一致模式的分析就绪数据集。
常用场景
经典使用场景
在烟草控制政策评估领域,该数据集最为经典的应用是用于纵向追踪非洲各国香烟包装健康警示规定的实施强度与时间演变。研究人员能够利用其覆盖2007至2024年、包含36个非洲国家的观测数据,量化分析各国警示标识的合规程度及其动态变化趋势,为跨国比较和政策有效性评估提供标准化的数据基础。
衍生相关工作
基于该数据集衍生出的经典工作包括构建非洲烟草控制政策指数,通过整合W1a指标与其他MPOWER维度指标,形成综合评估框架。此外,研究者利用其时空结构开发了政策扩散模型,揭示健康警示规定在非洲国家间的传播模式;亦有工作将其与烟草消费调查数据结合,运用因果推断方法评估警示标签对吸烟行为的干预效应,推动了公共卫生计量方法的创新。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区烟草制品包装健康警示标识的实施状况评估,是WHO《MPOWER》控烟框架中关键监测指标之一。前沿研究正借助此类国家层面纵向数据,量化警示标签政策对烟草消费行为的干预效果,并结合性别、城乡等维度差异,探索控烟措施在不同社会群体间的有效性。结合全球烟草控制框架公约(FCTC)背景下非洲各国立法进程的加速,该数据集为评估政策执行力度、识别区域控烟短板提供了可靠的基线数据,对推动非洲公共卫生政策优化具有重要实证价值。
以上内容由遇见数据集搜集并总结生成



