five

electricsheepafrica/africa-who-alcohol-0000001409

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-alcohol-0000001409
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲国家在2000-2020年间关于WHO GHO指标终身戒酒者比例(年龄标准化)的国家级观测数据。它是Electric Sheep Africa项目的一部分 - 一个统一的、适合机器学习使用的非洲数据仓库。数据直接来源于WHO全球健康观察站OData API,并以Parquet文件形式重新打包,采用一致的架构。所有值都来自NumericValue字段(浮点精度),而不是显示字符串。在可用的情况下包含置信区间边界(value_low, value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Alcohol, abstainers lifetime (%), age-standardized" (`SA_0000001409`) across African nations, spanning 2000–2020. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from `NumericValue` (the float-precision field), not the display string. Confidence interval bounds (`value_low`, `value_high`) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦于非洲国家2000年至2020年间年龄标准化后终生戒酒者比例(指标代码SA_0000001409)的观测数据。数据以Parquet格式统一封装,保留了原始数值精度字段NumericValue作为主要机器学习目标,并纳入了置信区间上下限(value_low、value_high)。数据集由Electric Sheep Africa团队整理,旨在构建一个适用于机器学习的非洲数据统一仓库,覆盖46个非洲国家,共计2898条记录,所有条目均限于WHO非洲区域(AFR)。
特点
该数据集具有多维分层特性,包含性别(SEX_BTSX、SEX_FMLE、SEX_MLE)等子维度,每个国家、年份与维度的组合生成独立行,便于细粒度分析。核心字段包括indicator_code、country_iso3、year及精确浮点值value_numeric,同时提供value_display格式化字符串。数据已按一致模式清洗,缺失置信区间时对应字段为空,确保结构化完整性。数据集体积适中(1K至10K行),既适合时间序列回归分析,也可用于分类任务。
使用方法
使用HuggingFace datasets库即可快速加载,通过load_dataset('electricsheepafrica/africa-who-alcohol-0000001409')获取数据,并转为Pandas DataFrame进行后续处理。可按子维度过滤,例如筛选dim1以'S'结尾的条目获取两性总体数据,或通过country_iso3字段选取特定国家(如KEN)并依年份排序以分析时间趋势。数据集可直接用于预测酒精戒断率的回归建模,或在分群后执行监督分类,其标准化架构也便于整合进更广泛的非洲健康指标分析管线。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队整理,源自世界卫生组织全球卫生观察站(WHO GHO),聚焦于非洲地区年龄标准化后终生戒酒者百分比这一公共卫生指标,时间跨度为2000年至2020年。数据集覆盖46个非洲国家,共包含2898条观测记录,通过统一的Parquet格式封装,旨在为机器学习研究提供高质量、可直接使用的非洲健康数据。其核心研究问题在于揭示非洲大陆酒精消费行为的时空分布特征,并为相关流行病学建模与政策制定提供数据支撑。作为Electric Sheep Africa系列的一部分,该数据集推动了非洲本土数据在机器学习领域的标准化与可复用性,对全球健康不平等、酒精政策效应评估及非洲公共卫生数字化转型具有显著的推动价值。
当前挑战
该数据集所解决的领域问题在于,非洲地区关于酒精消费行为的标准化、结构化数据长期稀缺,现有数据多分散于不同机构且格式不一,难以直接用于跨国家、跨时间的比较分析与机器学习建模。通过构建统一指标与一致架构,数据集为研究非洲酒精消费模式、健康干预效果及社会经济关联提供了可靠基础。构建过程中面临的挑战包括:从WHO OData API提取数据时需处理不同年份与国家间的数据缺失与置信区间不完整问题;指标按性别、居住地类型等维度分层导致数据稀疏,需合理设计过滤与聚合策略;同时,确保数据许可证合规(CC BY 4.0)及原始归属清晰,以保障开放科学道德与可追溯性。
常用场景
经典使用场景
在非洲公共卫生与流行病学研究中,该数据集常被用于分析不同国家和性别群体中终身戒酒者的年龄标准化比例。研究者可借助其结构化字段(如国家代码、年份、性别分层),构建横断面或纵向的时空分布模型,追踪2000至2020年间非洲大陆饮酒行为的变化趋势,揭示区域间戒酒率的差异与共性。
实际应用
在实际应用中,该数据常被世界卫生组织及非洲各国卫生部用于监测酒精控制政策的有效性,例如评估税收、广告禁令或健康教育推广对戒酒率提升的贡献。公共卫生机构可基于这些数据,识别高风险人群并优化资源配置,减少酒精相关疾病的社会经济成本。
衍生相关工作
该数据集衍生了一系列相关性研究,包括将戒酒率与肝病发病率、交通事故死亡率进行关联分析,以及构建非洲酒精消费的地理加权回归模型。部分工作还将其纳入多指标健康预测框架,结合经济数据与医疗资源分布,综合评估非洲区域健康风险,为后续政策模拟研究奠定了数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作