electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w4pcbackb
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w4pcbackb
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标其他烟制品包装背面健康警告覆盖主要展示区域的法定百分比(W4_pc_back_B)在非洲国家2007年至2022年的国家级观测数据。数据直接来源于WHO GHO OData API,并以Parquet文件形式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。该数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。
This dataset contains country-level observations for the WHO GHO indicator "Percentage of principal display area mandated to be covered by health warnings - back of other smoked tobacco packaging" (`W4_pc_back_B`) across African nations, spanning 2007–2022. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区烟草制品包装背面健康警示信息所占主要展示面积的法定百分比(指标代码W4_pc_back_B)。数据以Parquet格式重新封装,采用一致的列式架构,直接提取浮点精度的NumericValue值,避免使用显示字符串,并纳入置信区间上下限(value_low与value_high),从而确保数值的精确性与分析可信度。覆盖2007至2022年间33个非洲国家的179条观测记录,每个国家-年份组合仅对应单一数值,未进行如性别或年龄组的分层细分。
特点
该数据集的核心特点在于其指标的专业性——量化了非洲各国对烟草包装背面健康警示面积的法定要求,为评估烟草控制政策实施强度提供了可比较的跨年度度量。数据源自权威的WHO GHO,经Electric Sheep Africa项目重新整理,形成机器学习就绪的标准化格式,支持分类与回归任务。此外,数据集包含置信区间信息及清晰的时间跨度与地理范围,简化了国家间的纵向对比与趋势分析,尤其适合研究非洲区域烟草法规演进与公共卫生治理的关联。
使用方法
借助HuggingFace Datasets库可便捷加载数据,使用load_dataset函数直接读取为Pandas DataFrame对象。通过筛选dim1列中_ BTSX结尾的记录或空值,可获取全国层面的两性混合数据。对特定国家如肯尼亚,可基于country_iso3列过滤并依据year排序以构建时间序列。数据集无子维度分层,因此无需聚合操作,即可直接用于监督学习中的回归预测或分类建模,例如预测不同年份的警示面积比例变化趋势,或作为特征融入更广泛的卫生政策分析模型中。
背景与挑战
背景概述
该数据集由世界卫生组织全球卫生观测站(WHO GHO)于2007年至2022年间收集,由Electric Sheep Africa项目团队整合并发布于HuggingFace平台,旨在量化非洲各国规定在其它烟熏烟草包装背面健康警告信息占主要展示区域面积的百分比。这一指标聚焦于烟草控制政策中的健康警示有效性,是评估各国落实《世界卫生组织烟草控制框架公约》第11条实施情况的关键数据来源。数据集覆盖33个非洲国家,共179条观测记录,为研究非洲地区烟草包装健康警示政策的演进趋势、跨国比较及政策效果评估提供了标准化、机器可读的优质数据基础,对全球公共卫生领域的循证决策具有重要推动作用。
当前挑战
该数据集所解决的领域问题是烟草控制政策评估中健康警示覆盖率指标的可比性与量化分析难题,尤其是在政策执行力度差异巨大的非洲地区,各国在健康警示面积比例、更新频率及执行监管方面缺乏统一监测标准。构建过程中面临的挑战包括:从WHO GHO的OData API中提取并清洗包含置信区间的数值型数据,处理不同年份间国家定义变更导致的缺失值问题,以及确保33个非洲国家ISO代码与WHO区域分类的精确匹配。此外,数据稀疏性(仅179行)和时间跨度不均衡性(2007-2022年)限制了时间序列分析和机器学习模型的训练效果,需谨慎处理小样本下的过拟合风险。
常用场景
经典使用场景
在烟草控制政策评估领域,该数据集被广泛用于分析非洲各国烟草包装健康警示文字覆盖面积比例的时空演变趋势。研究者通过整理2007年至2022年间33个非洲国家的面板数据,可系统评估世界卫生组织《烟草控制框架公约》第11条实施细则在非洲地区的执行成效。数据集中提供的点估计值与置信区间,使得学者能够构建纵向比较模型,量化不同国家在烟草包装警示政策方面的立法严格程度与执法连续性。
实际应用
实际应用中,该数据集成为非洲公共卫生部门开展烟草控制政策效果审计的核心工具。各国卫生机构可依据此数据,动态监测本国烟草包装警示面积是否达到WHO建议的50%阈值,并对比邻国政策强度以调整立法优先级。国际非政府组织亦将其用于制定区域性的技术援助方案,例如依据数据集中警示覆盖比例较低的国家清单,精准投放包装设计培训与法律修订支持资源。
衍生相关工作
该数据集衍生出多项推动全球烟草治理的经典研究。其中,基于该数据的《非洲烟草包装警示政策趋同性分析》揭示了法语非洲国家与英语非洲国家在政策采纳速度上的显著差异;另有研究利用其时间序列特征结合贝叶斯层次模型,预测了2030年非洲大陆警示覆盖面积的收敛趋势。WHO在2023年发布的《全球烟草流行报告》中,亦引用了本数据集的统计分析结论作为政策建议的证据支撑。
以上内容由遇见数据集搜集并总结生成



