five

electricsheepafrica/africa-who-national-smoking-ban-number-of-places-smoke-free

收藏
Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-national-smoking-ban-number-of-places-smoke-free
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含2007年至2022年非洲47个国家关于国家禁烟令:无烟场所数量的观测数据,是世界卫生组织全球健康观察站(WHO GHO)指标的一部分。数据直接来源于WHO Global Health Observatory OData API,并以Parquet文件形式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator National smoking ban: NUMBER OF PLACES SMOKE-FREE (`P_count_places_sf`) across African nations, spanning 2007–2022. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于世界卫生组织全球卫生观察站(WHO GHO)的OData API构建,聚焦于非洲地区国家层面的烟草控制政策指标——‘无烟场所数量’(P_count_places_sf)。数据覆盖2007至2022年间47个非洲国家的423条观测记录,原始数值取自API返回的浮点精度字段NumericValue,并包含置信区间上下限。经由Electric Sheep Africa项目统一重封装为Parquet格式,所有字段遵循标准化模式,确保数据可直接用于机器学习流水线。
特点
数据集以简洁的扁平结构呈现,每条记录对应特定国家与年份的单一观测值,无额外分层维度(如性别或居住地类型),极大简化了分析复杂度。核心字段value_numeric作为主目标变量,辅以value_low与value_high提供不确定度信息,适合回归或分类任务。数据来源权威且许可开放(CC BY 4.0),同时涵盖了从安哥拉到津巴布韦等47个非洲国家的完整时间序列,为区域公共卫生研究提供宝贵资源。
使用方法
通过HuggingFace的datasets库可便捷加载数据,调用load_dataset即转换为Pandas DataFrame进行探索。推荐在分析时优先过滤dim1字段为SEX_BTSX或缺失的行以获取‘男女合并’的国家级指标。针对单一国家的时间序列研究,可依据country_iso3列筛选特定ISO代码(如KEN代表肯尼亚)并按年份排序。此外,置信区间字段为不确定性建模或多目标学习提供了天然输入,支持更稳健的统计推断。
背景与挑战
背景概述
该数据集由世界卫生组织(WHO)通过全球卫生观察站(GHO)创建,并由Electric Sheep Africa团队整合为机器学习就绪格式,时间跨度覆盖2007年至2022年。数据集聚焦于非洲地区国家层面的无烟场所数量统计,旨在系统评估各国在控烟政策实施中的成效。其核心研究问题涉及量化烟草控制法规对公共场所吸烟限制的覆盖面,为卫生政策制定者提供数据驱动的决策支持。作为非洲地区烟草控制监测的关键资源,该数据集填补了区域级精细化数据长期缺失的空白,对推动WHO《烟草控制框架公约》在非洲的落地具有显著学术与实践影响。
当前挑战
该数据集面临的领域挑战包括非洲国家间卫生数据收集能力不均导致的统计口径差异,以及吸烟限制定义在不同法律体系下的可比性问题。在构建过程中,原始WHO数据需从OData API抽取并重构为统一模式,但部分年份或国家存在置信区间缺失(如value_low/value_high字段不完整),且数据维度单一(无性别或地域层级属性),限制了多因素交互分析的能力。此外,423条记录中稀疏的时间序列与地理覆盖漏洞给时空建模与政策效果归因带来了额外障碍。
常用场景
经典使用场景
该数据集记录了2007至2022年间47个非洲国家无烟场所数量的指标,适用于分析与比较不同国家控烟法规执行力度的时序变化。经典用法包括利用该数据集构建回归模型,探究无烟场所数量与人口吸烟率、烟草消费量之间的关联,或通过机器学习方法预测控烟政策对公共卫生的影响。研究者可通过国家与年份的交叉筛选,进行面板数据分析,挖掘政策实施强度与吸烟行为变迁的内在联系。
解决学术问题
该数据集有效填补了非洲地区控烟政策量化数据的空白,解决了以往难以系统评估发展中国家无烟法规覆盖范围的学术难题。通过提供标准化、机器友好的结构,它使得跨国比较研究成为可能,助力分析控烟政策的广度与深度对疾病负担的缓解作用。数据集中的置信区间信息,为统计推断提供了稳健的基础,推动了控烟政策效能评估的实证研究,对丰富全球健康治理理论具有重要意义。
衍生相关工作
该数据集衍生出多项经典工作,包括构建非洲控烟政策指数,将其与心血管疾病发病率、呼吸系统疾病死亡率等指标进行多维度关联分析。研究者基于此数据开发了时序预测模型,模拟不同政策情景下未来十年无烟场所的覆盖趋势。亦有工作将其与世卫组织其他健康指标数据集融合,形成综合性非洲健康数据库,为跨学科的流行病学研究提供了丰富的数据支撑,并激发了关于数据驱动型政策评估方法论的探讨。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务