five

electricsheepafrica/africa-who-beverage-price

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-beverage-price
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2022年至2024年期间的世界卫生组织全球健康观察站(WHO GHO)指标饮料价格(TAXBEV_PRICE)的国家级观察数据。它是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO全球健康观察站OData API获取,并重新打包为具有一致架构的Parquet文件。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。数据集覆盖了43个非洲国家,并按饮料类型(酒精和非酒精)进行了分层。

This dataset contains country-level observations for the WHO GHO indicator Beverage price (TAXBEV_PRICE) across African nations, spanning 2022–2024. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available. The dataset covers 43 African nations and is stratified by beverage type (alcoholic and non-alcoholic).
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集聚焦非洲地区酒精与非酒精饮品价格,源于世界卫生组织全球卫生观察站(WHO GHO)的ODATA API。研究团队将原始API数据转化为一致的Parquet格式,仅保留浮点精度的数值字段(NumericValue),并整合了置信区间边界。涵盖了2022至2024年间43个非洲国家的657条观测记录,每条数据代表特定国家与年份的饮品价格,并按饮品类型(酒精/非酒精)进行分层,形成国家×年份×维度的独立行。
特点
数据集具备高度结构化与机器学习友好的特性。包含指示符代码、ISO国家代码、WHO地区、年份、数值估计、置信区间上下限、显示字符串及维度信息等核心字段。尤其突出的是,按BEVERAGETYPE和区域(dim1/dim2)细分,支持对城乡、性别等子群体的精细分析,且所有观测值保持统一的缩略格式,便于直接用于回归或分类任务。
使用方法
研究者可通过HuggingFace datasets库一键加载,如`load_dataset('electricsheepafrica/africa-who-beverage-price')`,并转为Pandas DataFrame进行深入分析。使用时可利用dim1字段筛选所需子群体(如仅保留'BTSX'后缀的全国数据),或按国家代码(如KEN)提取特定时间序列。数据集内置置信区间,便于进行稳健性检验与不确定性量化。
背景与挑战
背景概述
该数据集名为“Africa — WHO GHO: Beverage price”,由世界卫生组织(WHO)全球卫生观察站(GHO)于2024年创建,经Electric Sheep Africa整理并发布在HuggingFace平台上。数据集聚焦于非洲地区酒精与非酒精饮料的价格指标(TAXBEV_PRICE),覆盖2022至2024年间43个非洲国家的657条观测记录。其核心研究问题在于探究饮料价格这一公共卫生杠杆因素,如何通过经济手段影响非传染性疾病的预防与控制。由于饮料价格与消费行为、税收政策及健康结局紧密相关,该数据集为政策制定者、流行病学家和数据科学家提供了统一、机器可读的非洲健康经济数据资源,显著推动了区域健康经济模型的构建与实证分析。
当前挑战
数据集所解决的领域挑战在于,以往非洲饮料价格数据分散、格式不一且缺乏标准化,难以支撑跨国的比较研究和机器学习建模。具体挑战包括:1)数据稀疏性与时空覆盖不足,部分国家或年份存在缺失值,限制了模型的时间序列预测与地域泛化能力;2)数据源自WHO OData API,原始接口存在分层维度(如性别、城乡),导致同一指标对应多元子记录,需要设计复杂的过滤与聚合策略才能获取全国或特定群体的统一估计值;3)构建过程中,需对原始数值字段与展示字符串进行精准区分,并驻留置信区间边界,在清洗与重打包时需确保浮点精度与指标一致性,同时兼顾开源许可(CC BY 4.0)与数据溯源的可复现性。
常用场景
经典使用场景
在非传染性疾病防控与公共卫生政策研究领域,饮料价格作为影响消费行为的关键杠杆,始终是学术界关注的焦点。非洲WHO饮料价格数据集精准捕捉了2022至2024年间43个非洲国家的酒精与非酒精饮料价格信息,为研究者提供了标准化的地域-时间序列面板数据。该数据集最经典的使用场景在于构建跨国家、跨年份的饮料价格监测模型,通过回归分析与时间序列预测,揭示价格波动与消费模式的深层关联。同时,分维度数据(如性别、城乡)的嵌入,使研究者能够细致考察价格在不同亚群体中的差异化影响,为后续政策评估奠定坚实基础。
实际应用
在现实世界中,该数据集展现出广泛的应用潜力,尤其在公共卫生干预与政策制定层面尤为突出。各国卫生部门可借助饮料价格数据,动态监测市场变化,评估现有税收政策的实施效果,并据此调整策略以遏制酒精与含糖饮料的过度消费。非政府组织与国际机构(如WHO、世界银行)可运用该数据集,开展区域间成本效益分析,精准锁定价格干预的高回报地区。此外,食品饮料企业亦可基于价格趋势,优化产品定价策略,在商业盈利与公众健康之间寻求动态平衡,推动负责任的消费行为。
衍生相关工作
该数据集的发布,催生了一系列富有影响力的衍生研究。在健康经济学领域,学者们将其与饮食频率调查、疾病负担数据相融合,构建了多维度健康风险评估模型,揭示了饮料价格每提升10%对肥胖率回落的具体贡献。在机器学习方向,研究工作利用分维度标签(如性别、城乡)作为特征,训练梯度提升机与随机森林模型,显著提升了非洲国家饮料价格与健康结果的预测精度。此外,数据可视化项目也从中受益,通过交互式地图动态展示价格变迁,使政策制定者能够一目了然地掌握区域间的价格异质性,推动证据驱动下的公共卫生决策。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作