five

electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w3pcfronta

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w3pcfronta
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察指标“香烟包装正面健康警告覆盖主要显示区域的百分比”(W3_pc_front_A)在非洲国家的国家级观察数据,时间跨度为2007年至2022年。数据直接来源于WHO Global Health Observatory的OData API,并以Parquet文件格式重新打包,具有一致的架构。所有数值均来自NumericValue字段(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。数据集覆盖35个非洲国家,共214行数据,适用于机器学习和数据分析任务。

This dataset contains country-level observations for the WHO GHO indicator "Percentage of principal display area mandated to be covered by health warnings - front of cigarette packaging" (W3_pc_front_A) across African nations, spanning 2007–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家香烟包装正面健康警示覆盖面积的强制性比例(指标代码W3_pc_front_A)。原始数据经由Electric Sheep Africa项目重新整理,以Parquet格式打包,并采用统一的模式规范。所有数值均来自API中的浮点精度字段NumericValue,而非展示字符串,以保障建模的准确性。数据集涵盖2007至2022年间35个非洲国家的214条观测记录,每条记录对应一个国家与年份的组合,无额外子维度分层。当指标存在性别或居住地类型等分层时,数据会生成独立的行,并标注dim1与dim2字段,便于用户按需过滤或聚合。置信区间上下界(value_low与value_high)亦被保留,为统计推断提供了支持。
使用方法
数据集可通过HuggingFace Datasets库便捷加载,调用load_dataset函数即可获取训练集,并支持一键转换为Pandas DataFrame以进行后续分析。典型用法包括:利用dim1字段过滤出“男女综合(_BTSX)”或全国层面的观测值,以聚焦于整体趋势;按country_iso3字段提取特定国家的时间序列数据(如肯尼亚),用于纵向政策效果评估。由于数据量仅数百行且无分层复杂性,用户可直接对value_numeric列进行建模,或结合value_low与value_high构建区间估计。若需研究性引用,数据集附有标准BibTeX条目,确保学术使用的规范性。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)全球卫生观测站(GHO)创建,经由Electric Sheep Africa团队重新整理并发布在HuggingFace平台上,收录了2007年至2022年间覆盖35个非洲国家的关键政策指标——烟草包装正面健康警示所覆盖的主展示区面积百分比(W3_pc_front_A)。这一指标直接反映各国在控烟法规实施强度上的差异,是评估《世界卫生组织烟草控制框架公约》执行效果的核心定量依据。数据集以机器学习友好的Parquet格式封装,包含点估计值与置信区间,为比较卫生政策对烟草使用的长期影响提供了跨时空的标准化数据资源,推动了非洲地区健康政策分析的数据驱动转型。
当前挑战
该数据集所解决的核心领域问题在于量化非洲各国烟草控制法规的实际执行力度,弥补传统上依赖定性报告评价控烟进展的不足。面对数据稀疏性与国家间政策执行差异巨大的现状,通过统一指标框架揭示健康警示覆盖率的区域异质性。在构建过程中,挑战主要来自WHO原始API中数据的多维分层结构(如性别、城乡维度)与缺失值处理,需精确筛选全国层级的核心估计值,同时保留置信区间以支持不确定性建模。此外,数据集规模较小(仅214行)限制了复杂机器学习模型的直接应用,需借助迁移学习或时间序列外推技术提升其分析价值。
常用场景
经典使用场景
该数据集源自世界卫生组织全球卫生观察站(WHO GHO),专注于非洲国家香烟包装正面强制健康警示覆盖面积的百分比(W3_pc_front_A)。在烟草控制政策评估领域,该数据集为学术研究提供了关键指标。经典使用场景包括纵向追踪2007至2022年间35个非洲国家该比例的变化趋势,通过回归分析或面板数据模型,揭示各国烟草警示政策执行力度与公共卫生成果之间的关联。数据集结构清晰,包含数值估计和置信区间,便于构建时间序列预测模型或分类任务,例如预测某一国家是否达到世界卫生组织建议的警示面积阈值。其跨年度多国面板形式,使其成为分析非洲大陆烟草控制政策演进与区域差异的基准资源。
解决学术问题
该数据集系统性地填补了非洲烟草控制政策量化研究的空白,解决了既往缺乏标准化、细粒度数据以评估政策实施效果的核心难题。通过提供统一指标和一致模式,学者得以实证检验香烟包装警示面积政策对吸烟率、烟草消费量及相关健康指标的影响。其置信区间数据支持严格的政策效应推断,降低测量误差干扰。这项数据集推动形成更稳健的证据基础,揭示警示面积政策在低收入和中等收入非洲国家的真实效力,从而指导世界卫生组织《烟草控制框架公约》的区域化执行。其开放获取特性促进了跨国合作研究,助力全球烟草控制领域的知识积累。
实际应用
在实际应用中,该数据集为非洲各国卫生部门及国际公共卫生组织(如世界卫生组织、疾病预防控制中心)提供了政策监测与优化工具。通过分析警示面积变化的时间趋势,政策制定者可识别法规执行薄弱环节,并基于实证调整国家法规——例如提升最小警示面积阈值。非政府组织得以利用该数据集倡导强化烟草警示政策,开展针对性的公众健康宣传。此外,数据集被集成至机器学习工作流中,用于开发预测模型,预警烟草使用趋势或评估政策合规性。在跨学科合作中,它服务于环境健康、行为经济学及发展研究,例如探究政策对青少年吸烟率的长效影响。
数据集最近研究
最新研究方向
在全球公共卫生治理与烟草控制领域,该数据集聚焦于非洲国家卷烟包装正面强制健康警示覆盖面积比例(W3_pc_front_A)的时序演变与跨国比较。其核心价值在于为烟草税政策评估、警示标识合规性监测及健康传播效果研究提供机器可读的结构化面板数据。前沿研究方向包括:利用2007–2022年间35个非洲国家的指标记录,结合WHO非洲区域卫生监测框架,量化各国履约《烟草控制框架公约》第11条的执行力度;通过置信区间字段构建动态面板模型,分析警示面积比例与吸烟率、烟草消费量之间的因果关系;以及借助数据集的低缺失率特性(214行高密度观测),训练分类与回归模型预测烟草危害认知水平。该数据集的开放许可与标准化接口(HuggingFace Datasets)显著降低了公共卫生数据科学的研究门槛,为非洲烟草控制政策的循证优化提供了关键实证基础。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务