electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-frontbackc
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-frontbackc
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“无烟烟草包装正面和背面必须覆盖健康警告的主要显示区域百分比”(W2_pc_front_back_C)在非洲国家的国家级观察数据,时间跨度为2007年至2022年。数据集是Electric Sheep Africa系列的一部分,这是一个统一、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator "Percentage of principal display area mandated to be covered by health warnings - front and back of smokeless tobacco packaging" (`W2_pc_front_back_C`) across African nations, spanning 2007–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源于世界卫生组织全球卫生观察站(WHO GHO)的OData API接口,专注于非洲地区无烟烟草包装正面与背面强制健康警示覆盖面积占比这一指标(W2_pc_front_back_C)。数据经Electric Sheep Africa项目标准化重构,以Parquet格式储存,确保机器学习就绪。所有数值均取自精准的浮点字段NumericValue,并附有置信区间上下限,覆盖2007至2022年间29个非洲国家的166条观测记录。
特点
数据集以国家-年份为基本观测单位,无额外子维度分层,每个条目代表单一指标值。其模式设计简洁统一,包含国家ISO代码、WHO区域、年份、数值点估计、置信区间及格式化显示字符串等关键字段,显著特征在于提供了结构化且可直接用于分类或回归任务的表格数据,通过统一架构便于跨指标融合与时间序列分析。
使用方法
用户可通过HuggingFace的datasets库直接加载数据集,例如使用load_dataset函数调用相应标识符,并将训练集转化为Pandas DataFrame以进行灵活操作。典型应用包括筛选特定性别(如双性BTSX)或国家层面的数据,亦可通过国家ISO代码按年份排序提取时间序列,适用于烟草控制政策效果评估与健康警示覆盖趋势的机器学习建模分析。
背景与挑战
背景概述
烟草危害是非洲地区面临的重大公共卫生挑战之一,无烟烟草制品因其隐蔽性和广泛的消费群体,对控烟政策提出了独特要求。世界卫生组织(WHO)全球卫生观察站(GHO)自2007年起持续监测无烟烟草包装上健康警示覆盖面积的比例,这一指标直接反映了各国控烟法规的强制力度。该数据集由世界卫生组织创建,经Electric Sheep Africa机构整合为机器学习就绪格式,覆盖29个非洲国家、跨越2007至2022年的166条观测记录。作为非洲区域烟草控制政策评估的核心量化工具,该数据集为研究健康警示法规的演变趋势、跨国产出差异及其对消费行为的影响提供了不可替代的纵向证据,推动了公共卫生领域从描述性分析向预测性建模的范式转变。
当前挑战
该数据集所解决的领域问题聚焦于无烟烟草包装健康警示法规的量化评估,这一问题的核心挑战在于:其一,非洲各国执行标准差异显著,部分国家缺乏强制立法或更新滞后,导致指标缺失率较高;其二,健康警示覆盖面积与实质性警告效果之间的非线性关系难以建模,单纯的比例数据无法涵盖警示图形、语言种类等协同因素。在构建过程中,数据集面临多重困难:原始GHO数据经由OData API提取时,非洲区域近半数国家存在年度记录断裂,需通过置信区间填充策略保证时序连续性;此外,无烟烟草与卷烟包装法规的维度不一致性迫使研究者仅保留W2_pc_front_back_C单一指标,牺牲了跨品类比较的可能性。
常用场景
经典使用场景
该数据集聚焦于非洲国家无烟烟草包装正反面健康警示覆盖面积的法定百分比,是烟草控制政策评估领域的一项精细化指标。研究者通常将其用于面板数据分析或跨国比较研究,借助年份与国家的双重维度,追踪特定非洲国家在2007至2022年间健康警示面积规定的动态演变。数据集提供的点估计值与置信区间,为量化政策严格程度、构建政策成效回归模型提供了坚实的数值基础,是探索公共卫生法规变化趋势的经典工具。
衍生相关工作
该数据集衍生了多项经典学术工作,包括基于其数值特征开发的政策严格度评分模型,以及结合其他WHO指标(如吸烟率、戒烟意愿)构建的多维回归分析框架。研究者还将其作为训练数据,构建了预测非洲国家未来警示面积变化趋势的机器学习基准模型。此外,该数据集常与同类包装警告指标联合使用,形成综合性政策合规指数,成为非洲烟草控制政策效力分析的基石性资源,并催生了多篇发表于《烟草控制》等权威期刊的实证论文。
数据集最近研究
最新研究方向
在全球公共卫生领域,烟草制品包装警示标签的覆盖比例已成为衡量控烟政策执行力的关键指标。该数据集聚焦非洲国家无烟烟草包装正反面健康警示面积占比,涵盖2007至2022年间29个国家的纵向观测值,为追踪非洲区域控烟法规演变提供了量化基础。当前研究前沿集中于利用这些结构化数据构建时序预测模型,以评估不同国家警示面积与吸烟率变化的关联,并探索跨区域政策趋同或分化趋势。结合WHO全球烟草流行报告,这些数据可助力揭示法规实施滞后与公共卫生成果之间的动态关系,为优化非传染性疾病防控策略提供实证支撑。
以上内容由遇见数据集搜集并总结生成



