five

electricsheepafrica/africa-who-tobacco-warning-w2b-smoked-tobacco-packaging-health-warnings

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-tobacco-warning-w2b-smoked-tobacco-packaging-health-warnings
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家关于世界卫生组织全球健康观察指标烟草警告:W2b吸烟烟草包装健康警告,其他特征(`TOBACCO_MPOWER_W2B_TOBACCOSMOKED`)的国家级观察数据,时间跨度为2007年至2024年。数据来源于WHO全球健康观察OData API,并以Parquet文件格式重新打包,包含数值估计(浮点精度字段)和置信区间界限(`value_low`,`value_high`,如果可用)。数据集是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。

This dataset contains country-level observations for the WHO GHO indicator Tobacco Warning: W2b smoked tobacco packaging health warnings, other characteristics (`TOBACCO_MPOWER_W2B_TOBACCOSMOKED`) across African nations, spanning 2007–2024. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球健康观察站(WHO GHO)的OData API,聚焦于非洲地区烟草制品包装健康警示的第二类特征(W2b指标)。研究者通过标准化流程将原始数据重新封装为Parquet格式文件,保留了浮点精度字段`NumericValue`作为核心数值,并附带了置信区间上下界。数据集以国家-年份为基本观测单元,涵盖了2007年至2024年间32个非洲国家的242条记录。针对指标可能存在的分层维度(如性别、居住区域),每条观测均以唯一组合形式呈现,确保了数据结构的完整性与一致性。
使用方法
用户可通过HuggingFace的`datasets`库便捷加载该数据,仅需一行代码即可将之转换为Pandas DataFrame进行深入分析。典型操作包括:利用`dim1`字段过滤出“两性合计”的全国级观测值,或按国家代码(如`KEN`)提取特定国家的时间序列。数据集适用于监督学习任务(如预测烟草警示效果),也可用于描述性统计与可视化研究,其丰富的分层信息为亚群体差异分析提供了宝贵资源。
背景与挑战
背景概述
该数据集源自世界卫生组织(WHO)全球健康观测站(GHO),由Electric Sheep Africa团队整理并于2024年发布,聚焦非洲32个国家2007至2024年间关于“烟草警告:W2b卷烟包装健康警告及其他特征”的指标数据。其核心研究问题在于评估非洲地区烟草产品包装上健康警告的实施情况,为控烟政策(如MPOWER框架)的效果监测提供量化依据。该数据集以统一架构的Parquet格式呈现,包含置信区间等精细信息,填补了非洲区域烟草控制领域高质量、机器学习就绪数据的空白,对全球公共卫生政策制定与跨国民健康比较研究具有重要推动力。
当前挑战
该数据集所解决的领域挑战在于非洲烟草警告政策的异质性监测:32国不同时期包装警告的形态、覆盖率与执法强度差异显著,传统调研方法难以持续追踪,亟需标准化数据支撑循证决策。构建过程中面临多重困难,包括WHO原始API数据字段的异构性(如维度分层导致的条目膨胀)、部分国家多年份数据缺失或置信边界不全,以及将原始显示字符串解析为数值型变量时可能引入的精度误差,需通过一致化模式设计(如值字段取浮点而非字符串)与维度过滤逻辑来保证机器学习友好性。
常用场景
经典使用场景
在公共卫生与政策科学领域,该数据集最经典的使用场景在于评估非洲各国烟草包装健康警告的执行力度与覆盖特征。研究者可借助其国家层面的面板数据,量化不同年份间各国是否实施、更新或强化包装警告标识的差异,从而绘制出区域控烟政策的演进图谱。
解决学术问题
该数据集有效回应了非洲控烟政策研究中长期存在的数据碎片化与时间跨度不足的困境。它为学者提供了统一且机器可读的指标,用以检验MPOWER政策框架中‘警示公众’这一支柱在非洲大陆的实际落地效果,揭示了经济水平、治理能力与政策实施深度之间的微妙关联,并为全球控烟比较研究贡献了稀缺的区域级证据。
实际应用
在实际应用中,该数据集可作为国际组织与非洲国家卫生部进行政策审计与国别比较的核心工具。通过追踪包装警告的年度变迁,政策制定者能够识别出执行薄弱的节点,并优先调配资源去强化公众警示环节,进而推动烟草税同步调整与无烟环境监管形成协同效应,切实降低吸烟率。
数据集最近研究
最新研究方向
在全球公共卫生治理与烟草控制政策不断深化的背景下,该数据集聚焦非洲地区实施《世界卫生组织烟草控制框架公约》MPOWER系列措施中关于“卷烟包装健康警示(W2b)”子维度的关键进程与特征。研究前沿正从单一的政策覆盖率描述转向对警示标签设计、内容更新频率及图形警告等“其他特征”的细粒度量化分析,旨在通过时空序列数据揭示不同国家执行包装法规的差异性与合规路径。结合近年来国际社会对非洲烟草流行加剧的担忧,该数据集为构建预警模型、评估政策有效性及推动全球健康公平提供了标准化、可复用的机器学习就绪型支撑,其引入置信区间和多维分层字段更赋予了因果推断研究以坚实的数据基础,对指导本地化干预策略具有深远意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务