five

electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w3pcfrontc

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w3pcfrontc
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2007-2022年间关于世界卫生组织全球健康观察指标无烟烟草包装正面健康警告覆盖面积百分比(W3_pc_front_C)的国家级观测数据。它是Electric Sheep Africa项目的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来自WHO全球健康观察OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue字段(浮点精度),而非显示字符串。在可用的情况下,包含置信区间边界(value_low, value_high)。

This dataset contains country-level observations for the WHO GHO indicator Percentage of principal display area mandated to be covered by health warnings - front of smokeless tobacco packaging (W3_pc_front_C) across African nations, spanning 2007–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家无烟烟草包装正面健康警示覆盖面积占比的强制性规定。原始数据经统一清洗与重构后,以Parquet格式存储,保留`NumericValue`字段作为精确浮点数值,并纳入了置信区间边界(`value_low`、`value_high`)。数据集覆盖2007至2022年间28个非洲国家的154条观测记录,所有条目均经过ISO国家代码与WHO区域代码的标准化处理,构成了一个可直接用于机器学习流程的非洲专属数据仓库。
使用方法
借助HuggingFace的`datasets`库,用户可以便捷地加载该数据集,并通过`load_dataset`函数直接获取训练集。其与Pandas的无缝兼容性支持将数据转置为DataFrame格式,便于进行后续的过滤与分析。具体而言,可通过筛选`dim1`字段以提取全国性数据(如以`_BTSX`结尾的条目),或依据`country_iso3`列针对特定国家构建时间序列,从而服务于政策效果评估、跨国回归分析或预测任务。
背景与挑战
背景概述
在公共卫生政策评估领域,烟草控制措施的有效性监测始终是研究焦点。该数据集由世界卫生组织全球卫生观察站(WHO GHO)创建,经Electric Sheep Africa团队重新整合,聚焦非洲地区无烟烟草包装正面健康警示强制覆盖面积比例这一关键指标(代码W3_pc_front_C)。数据集涵盖2007至2022年间的28个非洲国家,共154条观测记录,为评估烟草控制政策执行情况提供了标准化、机器学习就绪的定量基础。其发布填补了非洲地区烟草健康警示政策量化数据的空白,有助于跨国比较与时间序列分析,对推动《世界卫生组织烟草控制框架公约》在非洲的实施具有重要支撑作用。
当前挑战
该领域面临的核心挑战包括:首先,非洲各国经济发展水平与立法进程差异显著,导致健康警示面积覆盖比例的政策执行力度参差不齐,如何从碎片化数据中准确提取可比较的指标成为关键难题。其次,数据集构建过程中面临跨来源数据整合的困难,WHO原始API返回的数值字段存在展示字符串与浮点精度值的不一致,需严格筛选NumericValue字段。此外,少部分观测缺乏置信区间信息,且年份跨度内部分国家存在数据缺失,如何在机器学习建模中妥善处理这些不完整记录,避免引入偏差,是实际应用的重要技术挑战。
常用场景
经典使用场景
该数据集聚焦于非洲国家在无烟烟草包装正面强制标注健康警示的面积占比,是评估烟草包装规制政策执行效果的核心指标。研究者常利用这一跨国面板数据,开展纵向时间序列分析与横向国别比较,用以揭示非洲地区健康警示面积规定的变迁趋势与区域差异。其简洁的表格结构——仅含国家、年份与百分比数值——使其成为回归分析、聚类分析及政策效应评估等经典计量建模任务的理想输入,尤其适合探究规制强度与公共卫生投入之间的潜在关联。
解决学术问题
在全球控烟研究中,非洲地区长期面临数据稀疏的困境,导致政策分析难以深入。该数据集有效填补了这一空白,为解决‘非洲无烟烟草包装警示政策的实施强度如何量化’这一基础学术问题提供了标准化指标。借助涵盖28个国家、跨度16年的观测值,学者得以实证检验健康警示面积规定的跨国趋同或分异模式,评估规制条款的落实程度,并为后续研究各国控烟政策与吸烟率、相关疾病负担之间的因果效应奠定数据支柱,推动非洲公共卫生政策研究迈向量化纵深。
实际应用
该数据集可直接服务于世界卫生组织及非洲各国卫生部门对烟草控制框架公约执行情况的监测与评估。公共卫生机构可借此追踪各国是否提高警示面积占比至推荐阈值,并识别出执行滞后的国家以提供定向技术援助。此外,非政府组织与政策倡导者能利用时间序列数据绘制可视化仪表板,向公众与立法者展示政策进展,增强舆论压力以推动更严格的警示规定。在学术-实践协作中,该数据集还可接入机器学习模型,预测政策扩散路径,辅助区域控烟战略的优化制定。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区无烟烟草包装正面健康警示面积占比的监管量化研究,反映了全球控烟政策在非洲的具体实施动态。随着世界卫生组织《烟草控制框架公约》不断推进,包装警示面积成为衡量政策执行力的关键指标。当前前沿方向包括:利用该变量进行纵向趋势分析,评估非洲各国警示面积法规的演变路径与政策滞后区域;结合社会经济与健康结局数据,构建因果推断模型,探究警示面积扩大对无烟烟草消费行为、认知转变及疾病负担的潜在干预效应。此外,该数据集因其标准化架构与接口兼容性,正被整合至跨区域比较研究与机器学习预测框架中,为精细化控烟政策模拟与证据驱动的区域健康治理提供了稀缺的量化基础。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务