five

electricsheepafrica/africa-who-tobacco-mpower-national-tobacco-control-programmes

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-tobacco-mpower-national-tobacco-control-programmes
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2008年至2024年间关于烟草MPOWER:国家烟草控制计划(NTCP)的国别观察数据。数据来源于WHO全球健康观察站OData API,并以Parquet文件格式重新打包。数据集涵盖了38个非洲国家,共526行数据,包括数值估计值、置信区间边界等。此外,数据集还提供了详细的模式描述和使用示例。

This dataset contains country-level observations for the WHO GHO indicator Tobacco MPOWER: National tobacco control programmes (NTCP) across African nations, spanning 2008–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区国家烟草控制规划(NTCP)的MPOWER指标。数据以Parquet格式打包,并采用一致的列式架构,旨在为机器学习应用提供便捷。所有数值均从原始的NumericValue浮点字段提取,而非显示字符串,确保了数据精度。此外,数据集还尽可能包含置信区间上下界(value_low与value_high),以增强统计分析价值。其覆盖了2008至2024年间38个非洲国家的526条观测记录,并根据WHO AFRO区域代码进行筛选。
特点
本数据集的核心特色在于其多维度分层结构,涵盖TOBACCO_INDICATOR_NTCP_FTE与TOBACCO_INDICATOR_NTCP_govt_exp两种子指标,且可按性别(SEX)或居住地区类型(RESIDENCEAREATYPE)等维度进行细分。每一行对应国家、年份与维度的唯一组合,用户可通过dim1与dim2字段筛选特定分层,或跨层聚合以获取全局趋势。这种精细化的设计使其既适合宏观比较,也能支持亚组分析,为烟草控制政策的评估提供了丰富的数据入口。
使用方法
用户可通过HuggingFace的datasets库直接加载数据集,调用load_dataset函数即可获取训练集并转换为Pandas DataFrame进行探索。针对常见的双性、国家级分析,可筛选dim1字段以包含'_BTSX'结尾或为空的行,从而排除性别分层。对于特定国家的时序研究,如肯尼亚,可依据country_iso3列过滤并按年份排序。这种灵活的筛选机制使得数据能够轻松适配从简单描述到复杂回归的各类任务场景,而无需额外预处理。
背景与挑战
背景概述
在全球公共卫生领域,烟草控制是降低非传染性疾病负担的关键举措。世界卫生组织(WHO)于2008年启动MPOWER系列措施,旨在帮助各国实施《烟草控制框架公约》。在此背景下,WHO全球卫生观察站(GHO)持续追踪各国烟草控制项目的执行情况。该数据集由Electric Sheep Africa于2024年基于WHO公开数据整理发布,聚焦非洲地区国家烟草控制项目(NTCP)的指标,核心研究问题在于量化非洲各国在烟草控制人力投入与政府支出方面的进展。数据集覆盖38个非洲国家、2008至2024年的时间跨度,为区域公共卫生政策评估与机器学习建模提供了标准化、可复用的数据基础,在非洲健康数据开放运动中具有里程碑意义。
当前挑战
该数据集所解决的领域问题在于,非洲地区长期缺乏统一、机器可读的烟草控制指标,传统数据分散于不同报告且格式各异,难以支持跨时间、跨国家的定量分析与预测建模。构建过程中面临两大挑战:其一,WHO原始API返回的数据存在维度分层(如性别、城乡),需通过筛选与聚合逻辑(如仅保留‘男女合计’与‘全国’层级)才能获得可比性强的数值;其二,部分年份与国家存在缺失值,置信区间数据亦不完整,需在保持数据完整性与统计严谨性之间寻求平衡,确保模型训练的鲁棒性。
常用场景
经典使用场景
非洲地区烟草控制国家规划数据集(africa-who-tobacco-mpower-national-tobacco-control-programmes)汇聚了世界卫生组织全球健康观察站关于非洲国家烟草控制规划执行情况的官方指标。这一数据资源覆盖38个非洲国家、时间跨度从2008年至2024年,主要记录了两类关键子维度:国家烟草控制规划的全职等效人员数量以及政府支出水平。研究者和政策制定者通常利用该数据集追踪各国在烟草控制领域的资源投入与政策实施动态,通过时间序列分析揭示区域内的变化趋势与国别差异,为评估MPOWER框架在非洲的落地成效提供量化基础。
实际应用
在实际应用层面,该数据集为非洲各国卫生部门及国际组织(如WHO、世界银行)制定和调整烟草控制策略提供了决策依据。通过分析各国烟草控制规划的全职等效人员配置与政府预算投入,政策制定者能够识别资源匮乏的高危国家,优先分配援助资金与技术力量。此外,数据集的年度观测值有助于监测各国对《世界卫生组织烟草控制框架公约》等国际承诺的履约进展,评估不同政策组合的实施效果,从而优化干预措施,例如在烟草税率提升、公共场所禁烟等政策出台后,追踪控烟规划执行能力的变化轨迹。
衍生相关工作
围绕该数据集已衍生出多项具有代表性的学术工作。基于时间序列数据的国别比较研究,学者们构建了非洲烟草控制规划能力的综合评价指标体系,揭示了北非与撒哈拉以南非洲在政策执行上的结构性鸿沟。另有研究者将本数据集与WHO其他烟草消费与健康结局指标(如吸烟率、烟草相关死亡率)进行联合分析,通过面板数据模型验证了MPOWER策略中规划资源投入对降低烟草流行的因果效应。此外,该数据集被整合进Electric Sheep Africa项目统一的非洲数据仓库中,为后续机器学习驱动的预测建模(如预测未来控烟规划需求)与区域聚类分析奠定了数据基础,推动了数据驱动的非洲公共卫生决策研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务