five

electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w4pcbacka

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w4pcbacka
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2007年至2022年间,世界卫生组织全球健康观察指标“香烟包装背面健康警告覆盖主要显示区域的百分比”(W4_pc_back_A)的国家级观测数据。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于世界卫生组织全球健康观察OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了35个非洲国家,共214行数据,区域筛选为WHO AFRO(ParentLocationCode = AFR)。

This dataset contains country-level observations for the WHO GHO indicator "Percentage of principal display area mandated to be covered by health warnings - back of cigarette packaging" (W4_pc_back_A) across African nations, spanning 2007–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 35 African nations with a total of 214 rows, filtered by WHO AFRO region (ParentLocationCode = AFR).
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在全球公共卫生治理框架下,烟草包装健康警示的覆盖比例是评估控烟政策执行效果的关键指标。该数据集聚焦非洲大陆,整合了世界卫生组织全球卫生观察站(WHO GHO)的官方指标“香烟包装背面主要展示区域强制覆盖健康警示的比例”(代码W4_pc_back_A)。构建过程中,数据通过WHO OData API直接获取,并经过标准化处理,提取高精度的浮点数值(NumericValue)作为核心字段,同时保留置信区间上下界。最终以Parquet格式文件存储,形成统一架构的机器学习就绪数据集,覆盖2007至2022年间35个非洲国家的214条观测记录。
特点
该数据集具有鲜明的结构化特点和专业针对性。其核心优势在于严格的区域限定性,专门提取WHO非洲区域(AFR)的国家级数据,排除了其他大洲混杂信息的干扰。数据模式清晰简洁,每行代表一个国家在特定年份的单一观测值,并详细记录了上下置信区间,为不确定性建模提供了宝贵支持。此外,数据集保留维度字段(dim1, dim2),允许用户灵活筛选性别、居住地类型等分层数据,增强了分析的多维度能力。整体规模适中,约214条记录,适合快速检索与比较研究。
使用方法
在应用层面,该数据集通过Hugging Face平台实现便捷访问。用户可借助`datasets`库中的`load_dataset`函数直接加载,例如`load_dataset('electricsheepafrica/africa-who-percentage-of-principal-display-area-mandated-to-be-covered-w4pcbacka')`。加载后数据被转换为Pandas DataFrame格式,便于进行数据清洗与建模。典型使用场景包括筛选全国层面、两性均等的数据(通过过滤`dim1`字段),或针对特定国家(如肯尼亚,代码KEN)按年份排序提取时间序列,从而分析其控烟政策变化趋势。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队从世界卫生组织(WHO)全球卫生观测站(GHO)整理发布,聚焦非洲地区烟草包装背面强制覆盖健康警示的面积比例(指标代码W4_pc_back_A),时间跨度覆盖2007年至2022年。烟草控制是全球公共卫生领域的核心议题,WHO《烟草控制框架公约》第11条明确要求烟草制品包装须包含大而清晰的健康警示,以降低吸烟率。该数据集为评估非洲各国实施健康警示政策的力度提供了量化工具,对推动区域烟草防控政策研究、机器学习建模及跨国比较分析具有重要价值。
当前挑战
领域层面的挑战在于,非洲各国烟草包装健康警示政策的执行差异显著,数据稀疏且存在缺失,难以系统评估政策的实际覆盖效果;部分国家缺乏长期可靠的监测机制,导致时间序列不完整,限制了趋势分析与因果推断。构建过程中的挑战包括:从WHO OData API整合多国多年度数据时需处理不一致的维度定义(如性别、城乡分层)和缺失置信区间值;数据格式从API原始结构转换为统一Parquet架构时,需保证数值精度与元数据对齐,同时避免复制因分层产生的冗余行;此外,数据集规模较小(仅214行),对机器学习模型的泛化能力构成潜在制约。
常用场景
经典使用场景
在非洲公共卫生政策研究领域,该数据集可作为评估烟草控制法规执行效力的核心分析对象。研究者能够利用其记录的2007至2022年间35个非洲国家的年度观测值,量化各国烟草包装背面健康警示覆盖面积的法定比例及其实际执行情况。数据集中包含的点估计值与置信区间,为时空维度的面板数据分析、趋势拟合及跨国比较提供了可靠基础,常被用于构建回归模型以探究政策强度与公共卫生成果间的关联。
实际应用
在实际应用中,该数据集被世界卫生组织及各国卫生部门用于监测《烟草控制框架公约》在非洲地区的履约进展。政策制定者可借助其中的数据快速评估本国烟草警告标识的立法完备性,并对比邻国实践以优化标准。非政府组织与公共卫生倡导团体则利用这些数值,在倡导活动中量化展示政策短板,或通过可视化工具向公众传达烟草危害信息的普及度,从而推动更严格的控烟法案出台。
衍生相关工作
围绕该数据集衍生出了一系列开源工具与学术再生产品。Electric Sheep Africa团队将其整合进统一架构的非洲数据集库,并提供了可直接加载至机器学习工作流的Parquet格式版本,促进了可重复性研究。在学术界,相关研究采用该数据构建了面板数据预测模型,探索政策强度与吸烟率之间的非线性关系。另有工作将其与WHO其他烟草控制指标(如包装正面警示比例、广告禁令范围)联合分析,生成了综合性政策指数,深化了对非洲烟草控制生态系统的理解。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务