electricsheepafrica/africa-who-tobacco-mpower-overview-monitor
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-tobacco-mpower-overview-monitor
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在WHO GHO指标烟草MPOWER概述:监测、保护人民、提供帮助、警告危险、执行禁令、提高税收(TOBACCO_MPOWER_OVERVIEW)上的国家层面观察数据,时间跨度为2007年至2024年。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory的OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。
This dataset contains country-level observations for the WHO GHO indicator Tobacco MPOWER overview: Monitor, Protect people, Offer help, Warn of dangers, Enforce bans, Raise taxes (TOBACCO_MPOWER_OVERVIEW) across African nations, spanning 2007–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
本数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,专门聚焦于非洲地区烟草控制MPOWER框架的宏观指标,涵盖2007年至2024年间47个非洲国家的观测数据。原始数据经过系统化清洗与标准化处理,以Parquet格式重新封装,并采用统一的数据模式。核心数值取自浮点精度的NumericValue字段,同时保留了置信区间边界(value_low与value_high)。数据集还整合了按性别或居住区域类型等维度分层的子指标,每个国家、年份与维度的唯一组合均形成独立行记录,确保了数据的完整性与结构化。
使用方法
研究人员可通过Hugging Face的datasets库便捷加载该数据集,一行代码即可获取结构化的数据表。建议使用to_pandas方法转换为DataFrame以便进行后续分析。对于关注国家层面整体情况的用户,可筛选dim1列为空或以_BTSX结尾的行来获取两性合计数据。若需探索特定国家的时间序列趋势,则可通过country_iso3字段(如'KEN'代表肯尼亚)结合year字段进行排序筛选。数据的分层维度(dim1与dim2)还为亚组分析提供了天然支持,使得按性别或城乡等变量进行对比研究变得直接高效。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2024年整理发布,源自世界卫生组织全球卫生观测站(WHO GHO),聚焦非洲47个国家2007至2024年间烟草控制MPOWER政策的执行概况。MPOWER框架涵盖监测烟草使用、保护人民免受烟草危害、提供戒烟帮助、警示烟草危害、禁止烟草广告促销和赞助、以及提高烟草税六大核心维度,是国际社会评估各国烟草控制成效的关键工具。该数据集以结构化表格形式呈现,包含置信区间与分层维度(如性别、城乡),为机器学习驱动的非洲公共卫生政策分析提供了高质量、标准化的数据基础,对追踪非洲地区烟草流行趋势、评估干预措施效果及推动循证决策具有重要价值。
当前挑战
领域层面,该数据集旨在解决非洲烟草控制政策评估中的数据碎片化与不可比性问题——WHO MPOWER指标虽为全球标准,但非洲各国数据采集能力不均、时间序列不完整,且需区分不同人口亚群(如性别、城乡)的暴露差异,增加了建模复杂度。构建过程中,挑战在于从WHO OData API原始接口中提取并清洗数十个分层子指标,部分观测值缺失置信区间,且需统一46个国家跨越17年的多源格式,排除显示字符串干扰,保留精确数值。此外,如何合理聚合或筛选分层数据(如按性别、居住地类型)以保证机器学习任务中的样本均衡性与代表性,是数据预处理与后续分析的难点。
常用场景
经典使用场景
非洲地区烟草控制是公共卫生领域的核心议题,该数据集汇聚了世界卫生组织全球卫生观察站关于烟草MPOWER政策的监测数据,覆盖2007至2024年间47个非洲国家的多维指标。其经典使用场景在于借助结构化表格数据,通过分类与回归任务评估各国在监测烟草使用、保护民众免受烟草危害、提供戒烟帮助、警示烟草危害、禁止烟草广告及提高烟草税等六大政策维度的实施成效。研究人员可运用该数据集构建预测模型,剖析不同国家与年份间政策执行强度的演变趋势,亦可结合性别与地域等分层变量,深入探索烟草控制干预措施的异质性效果。
解决学术问题
该数据集系统性地解决了非洲地区烟草政策量化分析中数据碎片化与可比性缺失的学术难题。以往研究常受限于单一国家或短期横截面数据,难以揭示跨时空的政策演进规律。此数据集的发布使得学者得以开展纵向比较研究,精准刻画MPOWER政策组合对烟草消费率、疾病负担及经济成本的动态影响。其意义在于为循证公共卫生决策提供可靠的数据基石,推动学术界从描述性统计迈向因果推断与机器学习驱动的政策优化分析,进而深化对发展中国家烟草流行规律的理论认知。
实际应用
在实际应用中,该数据集为国际卫生组织、非洲各国政府及非营利机构制定与调整控烟战略提供了量化支撑。政策制定者可利用其监测各国MPOWER指标的达标进度,识别政策薄弱环节,例如通过预警模型定位烟草广告禁令执行不力的国家,从而优先分配干预资源。公共卫生从业者能基于时间序列数据评估戒烟热线推广或税收上调措施的实际效果,优化干预策略。此外,该数据集还可服务于跨国政策评估项目,助力非洲联盟等区域组织推动统一的烟草控制框架,减少烟草相关疾病的早死负担。
数据集最近研究
最新研究方向
在全球公共卫生领域,烟草控制始终是各国政策制定的核心议题。该数据集聚焦非洲大陆,覆盖2007至2024年间47个国家的MPOWER政策实施进展,系统整合了监测、保护、帮助、警示、禁止和征税六大维度。前沿研究方向正从单一政策评估转向多维度联合建模,借助机器学习方法解析人口、社会经济与政策效应的交互关系,挖掘不同地域间的策略差异。尤为关键的是,研究者可基于其分层数据(如性别与城乡维度)深入分析弱势群体的暴露风险与干预效果,从而为WHO非洲区域控烟策略的精细化调整提供数据驱动支撑,助力实现全球健康公平愿景。
以上内容由遇见数据集搜集并总结生成



