five

electricsheepafrica/africa-who-how-many-health-warnings-are-approved-by-the-law-for-6numberhwc

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-how-many-health-warnings-are-approved-by-the-law-for-6numberhwc
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家WHO GHO指标无烟烟草包装上法律批准的健康警告数量(`W16_number_hw_C`)的国家级观测数据,时间跨度为2007年至2022年。它是[Electric Sheep Africa](https://huggingface.co/electricsheepafrica)集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自`NumericValue`(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(`value_low`,`value_high`)。

This dataset contains country-level observations for the WHO GHO indicator How many health warnings are approved by the law for smokeless tobacco packaging? (`W16_number_hw_C`) across African nations, spanning 2007–2022. It is part of the [Electric Sheep Africa](https://huggingface.co/electricsheepafrica) collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的官方OData API,聚焦于非洲地区无烟烟草包装上依法获批的健康警告数量这一关键指标(指标代码W16_number_hw_C)。数据经过系统化采集后,被重新封装为具有统一模式的Parquet文件格式,以提升机器学习的就绪性。在构建过程中,所有数值均提取自高精度的浮点型字段(NumericValue),确保了数据精度。同时,数据集还整合了可用情况下的置信区间边界值(value_low与value_high),并基于WHO AFRO区域代码对非洲国家进行了精准过滤,最终形成了覆盖27个非洲国家、时间跨度从2007年至2022年的184条观测记录。
特点
该数据集具备鲜明的结构化特征与高度一致性。其模式包含指标代码、国家ISO3代码、WHO区域、观测年份、核心数值估计及置信区间等关键字段,且每一条记录均对应唯一国家与年份的单一观测值,未引入额外子维度分层,因而避免了数据冗余。数据集专为表格分类与回归任务设计,并严格遵守CC BY 4.0许可协议,确保了使用的合法性与开放性。此外,作为Electric Sheep Africa系列的一部分,该数据集通过统一仓储和标准化的数据模式,显著降低了非洲相关健康数据分析的门槛。
使用方法
数据集的使用过程极为便捷,完全契合现代机器学习工作流。用户可通过HuggingFace Datasets库的load_dataset函数直接加载该数据集,并将其转换为Pandas DataFrame格式以便于后续分析。在具体应用中,可通过筛选dim1字段中后缀为_BTSX的行或处理空值,轻松获取针对两性总体的国家级数据。同时,利用country_iso3字段与sort_values方法,研究者能够快速提取特定国家(如肯尼亚)的时间序列数据,进行纵向趋势分析。数据集以训练集形式存储于'train'分区中,支持直接用于模型训练与评估。
背景与挑战
背景概述
在全球公共卫生领域,烟草制品包装上的健康警示信息是降低烟草消费、提升公众健康意识的关键政策工具。然而,非洲地区由于数据分散、监测体系薄弱,长期以来缺乏系统化的量化指标来评估各国法律对无烟烟草包装健康警告的批准状况。为此,世界卫生组织(WHO)全球卫生观测站(GHO)于2007年至2022年间,针对27个非洲国家构建了该数据集,旨在填补这一数据鸿沟。该数据集由Electric Sheep Africa团队从WHO官方ODA接口提取并重新封装,形成统一的机器学习就绪格式,为跨国比较、政策评估以及时间序列分析提供了可靠基础,对推动非洲控烟政策研究和数据驱动决策具有重要价值。
当前挑战
该数据集所解决的领域问题在于,非洲无烟烟草包装健康警告的法规合规性缺乏定量评估工具,传统上依赖分散的定性报告,难以支撑区域政策分析与机器学习建模。具体挑战包括:数据稀疏性,184条记录覆盖27个国家、16年跨度,部分国家年份数据缺失,影响时间序列模型的鲁棒性;信度不确定性,置信区间边界仅部分可用,使得点估计的可靠性不易量化;维度复杂性,尽管当前指标无子维度,但其他WHO指标常按性别、城乡分层,需设计灵活的过滤与聚合策略。构建过程中的挑战则涉及从API抓取异构数据、统一字段命名与类型清洗,以及将原本面向展示的字符串值(如“58.3 [57.7–59.0]”)精确转换为浮点型数值,同时保留置信区间,确保数据科学可用性。
常用场景
经典使用场景
该数据集聚焦于非洲各国法律批准的无烟烟草包装健康警示数量,为研究烟草控制政策的区域差异提供了珍贵的定量依据。研究者可基于国家与年份维度,探索各国在健康警示立法上的执行力度与演变趋势,进而评估全球烟草控制框架公约在非洲的落实进展。其结构化表格数据形式,特别适合用于分类与回归任务,譬如预测某国警示数量的合规等级,或建模社会经济变量与警示数量之间的关联。
衍生相关工作
该数据集衍生了一系列关乎烟草政策与公共健康关联的经典研究,例如结合社会经济指标构建回归模型,探究健康警示数量与吸烟率变化之间的因果关系。基于此,学者进一步推导出政策强度指数,用于比较非洲与全球其他区域的控烟成效。还有工作将其纳入多国时间序列分析,揭示特定年份立法突变与外部援助或国际压力之间的关联,为理解跨国政策扩散机制提供了创新视角。
数据集最近研究
最新研究方向
该数据集聚焦于非洲各国法律批准的无烟烟草包装健康警告数量,是WHO全球卫生观察站(GHO)指标体系的组成部分。在当前全球控烟政策持续强化、无烟烟草产品监管日益受到关注的背景下,该数据集为评估非洲地区公共卫生法规执行力度提供了关键的量化依据。前沿研究可借助此数据样本来探究各国控烟立法中的监管异质性,分析健康警告数量与吸烟率变化之间的关联,并借助时间序列挖掘区域控烟政策演进的内在规律。此外,将本数据集与GHO其他指标如烟草税率、吸烟相关疾病负担等联合建模,有助于揭示健康警告作为一种政策工具的干预效果与边际收益,为非洲各国修订控烟法规、制定更有针对性的公共卫生策略提供实证支撑。整体而言,该数据集在推动全球南方控烟政策评估与跨域比较研究方面具备重要学术价值与现实意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务