five

electricsheepafrica/africa-who-proportion-of-population-with-primary-reliance-on-polluting

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-proportion-of-population-with-primary-reliance-on-polluting
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含非洲各国WHO GHO指标主要依赖污染性燃料和技术进行烹饪的人口比例(%)的国家级观测数据,时间跨度为1990年至2023年。数据集是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接来源于WHO Global Health Observatory的OData API,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low, value_high)。

This dataset contains country-level observations for the WHO GHO indicator Proportion of population with primary reliance on polluting fuels and technologies for cooking (%) across African nations, spanning 1990–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观测站(WHO GHO)的OData API,专门针对非洲地区进行了系统化的整合与再封装。原始数据包含了1990年至2023年间47个非洲国家关于“主要依赖污染燃料和烹饪技术的人口比例”这一指标的观测值。构建过程中,所有数值均采用浮点精度的`NumericValue`字段,而非显示字符串,同时保留了置信区间上下限。数据集以Parquet格式存储,并统一了模式,旨在为机器学习任务提供干净、一致的数据源。
使用方法
用户可直接通过HuggingFace的`datasets`库加载该数据集,使用`load_dataset("electricsheepafrica/africa-who-proportion-of-population-with-primary-reliance-on-polluting")`命令,并将其转换为Pandas DataFrame进行后续分析。例如,可通过`dim1`字段过滤出全国总人口(男女合计)的数据,或按国家代码(如`KEN`)提取肯尼亚的时间序列。该数据集适用于分类与回归任务,支持面板数据分析和机器学习建模。
背景与挑战
背景概述
该数据集由世界卫生组织全球卫生观察站(WHO GHO)于2023年创建,并由Electric Sheep Africa团队重新整理发布,聚焦非洲47个国家1990至2023年间依赖污染燃料和烹饪技术的人口比例。作为一项关键公共卫生指标,该数据集直接回应了室内空气污染对非洲居民健康的深远影响,揭示了清洁能源可及性不足带来的系统性风险。其影响力体现在为环境健康研究、可持续发展目标监测及政策制定提供了标准化的时空数据基础,尤其适用于机器学习驱动的区域健康评估与预测建模。
当前挑战
数据集面临的核心领域挑战在于:污染燃料使用与呼吸道疾病、早逝风险的复杂关联难以通过单一指标捕捉,需整合多维社会经济学数据才能准确刻画健康负担。构建过程中,主要挑战包括:1)WHO监测体系在不同国家间存在报告频率与数据质量差异,导致时序信息不连续;2)城乡分层的置信区间缺失率较高,削弱了次国家级分析的可靠性;3)多源异构数据(如不同国家调查方法)的标准化对齐增加了数据清洗难度,需谨慎处理离群值与测量偏差以保证模型输入一致性。
常用场景
经典使用场景
该数据集记录了1990至2023年间47个非洲国家居民主要依赖污染性燃料和烹饪技术的人口比例,是探索环境健康与社会经济交叉领域的重要资源。在流行病学与公共卫生研究中,它常被用于量化家庭能源污染暴露的水平与时空演变趋势,为评估室内空气污染带来的疾病负担提供基础数据。同时,该数据集的亚维度划分(如城乡、性别)使得研究者能够深入剖析不同群体在清洁能源可及性方面的差异,从而支持更有针对性的干预策略设计。
解决学术问题
该数据集有效解决了非洲地区家庭能源使用与健康后果之间定量关联证据匮乏的学术难题。通过提供标准化、可比较的时间序列数据,研究者得以构建面板数据模型,识别污染燃料使用率与呼吸系统疾病、心血管疾病及儿童死亡率等健康结局之间的统计关系。此外,该数据还能与气象、经济、教育等多源数据融合,助力探究城镇化进程、收入增长与能源转型之间的交互作用,从而揭示清洁能源推广的政策障碍与驱动因素。
实际应用
在实际应用中,该数据集为国家与区域的能源规划及公共卫生政策提供了实证依据。国际组织与各国卫生部门可基于这些数据追踪可持续发展目标中关于清洁烹饪能源的子目标进展,识别高污染区域并优先分配资源。同时,数据中的置信区间信息有助于决策者在不确定性条件下评估不同减排情景的健康收益,进而制定更具成本效益的干预方案,例如推广改良炉灶或液化石油气替代传统生物质燃料。
数据集最近研究
最新研究方向
该数据集聚焦于非洲地区居民对污染性烹饪燃料与技术的依赖比例,为研究室内空气污染与公共卫生、能源公平及可持续发展目标(SDG 7)之间的关联提供了关键时空数据支撑。前沿方向包括利用该时间序列数据构建机器学习模型,预测非洲国家向清洁能源转型的路径与障碍,或结合社会经济与气候数据揭示污染燃料使用背后的结构性不平等。随着WHO全球健康观察站数据的持续更新和HuggingFace平台上标准化ML-Ready数据集的开放,研究者得以跨越国界,系统性评估非洲大陆因烹饪燃料导致的疾病负担,并量化干预政策的潜在健康收益,推动从数据驱动到行动导向的能源-健康跨学科研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务