electricsheepafrica/africa-who-annual-budget-for-tobacco-control-in-currency-reported
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-annual-budget-for-tobacco-control-in-currency-reported
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含非洲国家在2008年至2022年间关于烟草控制的年度预算数据,数据来源于WHO Global Health Observatory。数据集被重新打包为Parquet文件,包含国家代码、年份、数值估计、置信区间等信息。数据集覆盖了27个非洲国家,共计196行数据。数据主要用于表格分类和回归任务。
This dataset contains country-level observations for the WHO GHO indicator "Annual budget for tobacco control in currency reported" (`NTCP_govt_exp`) across African nations, spanning 2008–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲地区烟草控制年度预算这一特定指标(NTCP_govt_exp)。原始数据经过系统化采集后,被重新封装为具有一致模式的Parquet文件,所有数值均取自高精度浮点字段NumericValue,而非显示字符串。数据跨度涵盖2008年至2022年,共收录27个非洲国家的196条观测记录,并通过WHO AFRO区域代码进行地理范围过滤,确保数据集的区域聚焦性与完整性。
使用方法
数据集通过HuggingFace的datasets库即可便捷加载,转换为Pandas DataFrame后即可展开分析。使用者可按需过滤出两性综合、全国层面的子集,例如通过筛选dim1字段以`_BTSX`结尾或为空值的行获取基础数据。亦支持对国家层面进行时间序列分析,如选取特定ISO代码的国家并按年份排序,从而观察其烟草控制预算在时间维度的演变趋势,适用于回归、分类或趋势预测等典型任务场景。
背景与挑战
背景概述
烟草控制是全球公共卫生领域的重要议题,世界卫生组织(WHO)通过全球健康观察站(GHO)持续监测各国控烟投入。该数据集由Electric Sheep Africa于2024年整理发布,聚焦非洲地区,收录了2008至2022年间27个非洲国家在控烟方面的年度预算数据,以当地货币报告。核心研究问题在于评估非洲国家在WHO《烟草控制框架公约》下的财政承诺执行情况,填补了该区域长期缺乏标准化、机器可读控烟预算数据的空白。数据集对于推动非洲控烟政策的量化分析、跨国比较及机器学习建模具有重要价值,为卫生经济学和公共政策研究提供了可靠的数据基础。
当前挑战
该领域面临的首要挑战在于控烟预算数据在非洲国家的报告不一致性与覆盖不完整性。许多国家缺乏长期连续的财政记录,导致时间序列稀疏,2008至2022年间仅196条观测值,无法充分支持稳健的预测模型。构建过程中,数据清洗面临多重困难:原始WHO API返回的数值形式不一,需统一提取浮点型字段;置信区间边界值缺失比例高,影响统计推断的可靠性。此外,部分记录存在分层维度(如性别或城乡),但多数年份只有全国性数据,使得子群体分析受限。货币单位未统一且通胀未调整,增加了跨国横向比较的复杂性,对建模时的标准化处理提出了更高要求。
常用场景
经典使用场景
在公共卫生政策与健康经济学领域,该数据集最经典的用途在于评估非洲各国烟草控制预算的时空演变趋势。研究者可借助196条覆盖2008至2022年间27个非洲国家的观测记录,构建面板数据模型,分析预算分配与国家烟草流行率、疾病负担之间的关联。通过挖掘‘NTCP_govt_exp’指标所蕴含的财政承诺信息,能够揭示各国在履行《世界卫生组织烟草控制框架公约》过程中资金投入的动态变化,为后续比较研究提供标准化数据基础。
解决学术问题
该数据集核心解决了非洲烟草控制领域长期存在的资金透明度不足与跨国比较缺乏统一基准的学术困境。传统研究中,各国年度预算数据因统计口径各异而难以直接对齐,该数据集通过WHO GHO标准化接口整合,并提供点估计值及置信区间,使得学者得以系统检验‘财政投入是否有效降低烟草消费’这一关键假说。其贡献在于将离散、异构的国家报告转化为结构化的回归分析语料,推动了烟草经济学与全球卫生治理的量化研究边界。
实际应用
在实际应用层面,该数据集可为世界卫生组织非洲区域办事处及各国卫生部门提供预算履职的监测基准。政策制定者能够依据历年预算序列识别资金投入波动的关键节点,例如某国在烟草税提高后年份的预算变化,从而优化资源配置。非政府组织亦可结合该数据与本地吸烟率调查,评估控烟倡议的实际成效,并将结果用于倡导更合理财政分配。此外,数据中的置信区间字段支持不确定性分析,有助于在资源有限的环境中做出更稳健的决策。
数据集最近研究
最新研究方向
在全球公共卫生治理领域,烟草控制财政资源分配已然成为衡量各国履约能力的关键指标。基于世界卫生组织全球卫生观测站(GHO)发布的非洲地区烟草控制年度预算数据,该方向聚焦于非洲大陆27国在2008至2022年间的政府专项支出动态。当前前沿研究致力于运用时序分析与跨国比较框架,揭示烟草流行高负担国家在预算承诺与实际拨款间的鸿沟,并结合世界卫生组织《烟草控制框架公约》的执行进程,评估财政资源对控烟政策效能的调节作用。该数据集以标准化格式呈现为机器学习友好型结构,为开展结构化预测、预算缺口识别以及政策因果推断提供了坚实的数据基座,其开放共享也推动了非洲本土控烟研究从描述性统计向预测性建模的范式跃迁。
以上内容由遇见数据集搜集并总结生成



