electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w4pcbackc
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w4pcbackc
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2007年至2022年间,世界卫生组织全球健康观察指标“无烟烟草包装背面健康警告覆盖主要显示区域的百分比”(W4_pc_back_C)的国家级观察数据。数据集是Electric Sheep Africa项目的一部分,该项目是一个统一的、适合机器学习使用的非洲数据仓库。数据直接来源于WHO Global Health Observatory的OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自浮点精度字段NumericValue,而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖28个非洲国家,共计154行数据,区域筛选为WHO AFRO(ParentLocationCode = AFR)。
This dataset contains country-level observations for the WHO GHO indicator "Percentage of principal display area mandated to be covered by health warnings - back of smokeless tobacco packaging" (`W4_pc_back_C`) across African nations, spanning 2007–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available. The dataset covers 28 African nations with a total of 154 rows, filtered by WHO AFRO region (`ParentLocationCode = AFR`).
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的开放数据API,聚焦于非洲地区无烟烟草包装背面强制覆盖健康警示的主要展示面积百分比(指标代码W4_pc_back_C)。原始数据经Electric Sheep Africa项目系统化整合,以Parquet格式存储,并采用统一架构重新封装。所有数值均源于原始数据中的浮点精度字段NumericValue,而非显示字符串,同时保留了可用的置信区间上下界(value_low与value_high)。数据集涵盖了2007年至2022年间28个非洲国家共154条观测记录,每条记录代表特定国家在特定年份的单一指标值,无子维度分层。
使用方法
用户可通过HuggingFace datasets库轻松加载该数据集,仅需一行代码即可自动下载并转换为Pandas DataFrame,便于后续分析。对于需要关注总体趋势的研究,可通过过滤dim1字段中后缀为_BTSX或缺失值的方式获取全国性两性混合数据。时间序列分析同样便捷,例如通过筛选国家代码并排序年份即可提取特定国家的年度变化轨迹。数据集本身已具备明确的机器学习就绪特性,不仅指标类型清晰(tabular-classification与tabular-regression),且每个特征均有详细描述,为预测建模和回归分析提供了稳健的数据基础。
背景与挑战
背景概述
在全球公共卫生领域,烟草制品警示标识的覆盖范围是评估控烟政策有效性的关键指标之一。世界卫生组织(WHO)全球卫生观察站(GHO)自2007年起系统性收集各成员国烟草包装健康警示所占面积比例的数据,为国际控烟研究奠定数据基础。该数据集聚焦于非洲地区无烟烟草产品包装背面的法定警示面积百分比(指标代码W4_pc_back_C),由Electric Sheep Africa团队于2022年基于WHO公开API整理并统一格式发布,涵盖28个非洲国家2007至2022年间154条观测记录。作为首个面向非洲大陆的机器学习友好型控烟政策数据集,它揭示了非洲地区在无烟烟草管控立法执行层面的区域异质性,为跨国比较分析、政策效果评估及公共卫生建模提供了重要的结构化数据支撑。
当前挑战
该数据集所解决的领域问题核心在于量化非洲各国无烟烟草包装健康警示的法定覆盖强度,填补了非洲大陆在控烟政策比较研究中精细化数据的空白。然而,构建过程中面临多重挑战:首先,WHO原始数据存在维度层级复杂(如按性别、城乡分层)、置信区间缺失及显示字符串与数值字段不一致等问题,需通过严格的数据清洗与标准化处理确保一致性。其次,非洲29个国家中仅28个存在有效记录,数据稀疏性限制了时间序列分析和跨区域横向对比的统计效力。此外,单一年份的横截面数据占比显著,缺乏连续年度观测,导致政策迭代效果的动态评估面临不确定性。最后,数据仅反映法定要求而非实际执行情况,需结合其他来源(如执法审计数据)方可全面解构政策落地效果。
常用场景
经典使用场景
该数据集收录了2007至2022年间28个非洲国家关于无烟烟草包装背面健康警示覆盖面积占比的核心指标(W4_pc_back_C),是评估非洲区域烟草控制政策执行力的关键数据资源。研究者可基于此数据集构建时间序列模型,追踪各国立法要求与实际警示面积占比的演变轨迹;亦可结合国家特征变量开展横截面回归分析,探索经济发展水平、卫生投入等宏观因素与政策严苛程度的关联。该数据集凭借其来源权威、结构统一、指标聚焦的特点,成为比较公共卫生政策异质性、检验烟草控制框架公约(FCTC)第11条实施成效的理想样本。
解决学术问题
该数据集直接回应了全球健康治理领域一个长期悬而未决的学术命题:如何量化评估政策文本与实际执行之间的鸿沟?通过提供连续年份、多国可比的政策法规指标,它使研究者得以检验包装警示面积占比是否随时间推移显著提升,以及不同政治体制或经济水平的国家在政策趋同或分化中呈现何种规律。更重要的是,该数据填补了非洲区域烟草控制政策量化研究的空白,为揭示警示标识对无烟烟草使用行为的影响路径提供了关键自变量,推动了政策科学、行为经济学与流行病学交叉领域的理论建构。
实际应用
在实际应用中,该数据集为世界卫生组织非洲区域办公室及各国卫生部门提供了动态监测工具,可定期比对各成员国在烟草包装警示法规上的达标进展,识别政策执行滞后的国家并推动技术援助。非政府组织可在倡导活动中引用这些量化证据,向立法者展示本国与国际标准的差距,加速卫生警示覆盖率的强制性提升。此外,公共卫生机构能够将数据集中的政策变量与无烟烟草消费流行病学调查相连接,评估法规强度改变对人群使用率的影响,从而优化控烟干预策略的优先级。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家无烟烟草包装背面健康警示面积占比的强制性规定,是WHO全球健康观察(GHO)框架下针对烟草控制政策评估的前沿数据资源。结合近年来非洲地区控烟立法加速推进的热点事件,该数据集为量化各国政策执行力度、比较区域性健康警示覆盖标准提供了关键指标。通过分析2007至2022年间28个非洲国家的纵向数据,研究者能够追踪无烟烟草制品包装警示面积的演变趋势,评估其与吸烟率、健康意识及政策合规性的关联。这一数据集的发布填补了非洲无烟烟草管控领域结构化、机器学习就绪数据的空白,为循证政策制定、跨境比较研究以及基于时间序列的预测模型训练奠定了坚实基础,在推动全球健康公平和区域特异性控烟策略优化中具有深远意义。
以上内容由遇见数据集搜集并总结生成



