five

electricsheepafrica/africa-who-proportion-of-population-with-primary-reliance-on-clean

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-who-proportion-of-population-with-primary-reliance-on-clean
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含世界卫生组织全球健康观察站(WHO GHO)指标“主要依赖清洁燃料和技术烹饪的人口比例(%)”(PHE_HHAIR_PROP_POP_CLEAN_FUELS)在非洲国家的国家级观察数据,时间跨度为2000年至2023年。这是Electric Sheep Africa集合的一部分,这是一个统一的、适合机器学习使用的非洲数据存储库。数据直接从WHO Global Health Observatory的OData API获取,并以Parquet文件格式重新打包,具有一致的架构。所有值均来自NumericValue(浮点精度字段),而非显示字符串。在可用的情况下,还包括置信区间边界(value_low,value_high)。

This dataset contains country-level observations for the WHO GHO indicator "Proportion of population with primary reliance on clean fuels and technologies for cooking (%)" (PHE_HHAIR_PROP_POP_CLEAN_FUELS) across African nations, spanning 2000–2023. It is part of the Electric Sheep Africa collection — a unified, ML-ready repository of African data. Data is sourced directly from the WHO Global Health Observatory OData API and repackaged as Parquet files with a consistent schema. All values are drawn from NumericValue (the float-precision field), not the display string. Confidence interval bounds (value_low, value_high) are included where available.
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界卫生组织全球卫生观察站(WHO GHO)的OData API,聚焦非洲47个国家从2000年至2023年间“主要依赖清洁燃料和技术进行烹饪的人口比例”(指标代码PHE_HHAIR_PROP_POP_CLEAN_FUELS)。数据经过系统化处理,以Parquet文件格式重新封装,并采用统一的数据模式,所有观测值均取自浮点精度的数值字段,而非显示字符串,同时保留可用的置信区间上下界。
使用方法
用户可通过HuggingFace的datasets库直接加载数据集,如load_dataset('electricsheepafrica/africa-who-proportion-of-population-with-primary-reliance-on-clean'),并可转换为Pandas DataFrame进行后续操作。为聚焦国家整体情况,建议筛选dim1以_BTSX结尾或为空的行,表示两性合计数据;通过country_iso3字段可按年份排序提取特定国家的时间序列,便于进行趋势分析与回归建模。
背景与挑战
背景概述
该数据集由Electric Sheep Africa团队于2023年基于世界卫生组织全球卫生观察站(WHO GHO)的公开数据重新整理发布,聚焦于非洲47个国家2000至2023年间主要依赖清洁燃料和烹饪技术的人口比例。作为非洲数据统一化、机器学习就绪仓库的一部分,该数据集旨在应对发展中国家室内空气污染这一重大公共卫生议题,为量化清洁能源转型进展提供标准化、可复用的结构化数据。其影响力体现在为流行病学、环境健康及可持续发展目标(SDG 7)相关研究提供了纵向、跨国的比较基础,尤其在推进非洲地区能源政策评估与机器学习模型训练方面具有关键价值。
当前挑战
该数据集所解决的领域问题核心在于量化非洲地区清洁烹饪普及率的时空差异,以弥补高分辨率数据缺失对健康影响评估的制约。构建过程中面临的挑战包括:一是整合来自WHO GHO API的异构原始数据,需统一因年度报告、国家编码及分层变量(如城乡、性别)导致的格式差异;二是处理置信区间缺失的问题,大量观测值仅有点估计而缺乏不确定性度量,这限制了模型对统计精度的捕捉;三是跨47国、24年度的稀疏时间序列可能加剧机器学习中的小样本与不平衡学习难题。
常用场景
经典使用场景
在非洲公共卫生与环境健康领域,该数据集被广泛用于评估不同国家和地区居民清洁烹饪燃料使用情况的时空演变趋势。研究者可基于国家-年份二维面板数据,结合城乡分层维度,揭示能源转型进程中的区域异质性。典型应用包括构建多元线性回归或随机效应模型,以量化清洁燃料覆盖率与宏观经济指标、医疗资源分布之间的关联,为国际卫生组织及非洲各国制定能源政策提供数据驱动的决策依据。
解决学术问题
该数据集有效回应了长期以来非洲地区清洁能源数据碎片化、标准化不足的困境。通过提供跨越24年、覆盖47个国家的连续观测值及置信区间,它支撑了关于能源贫困与呼吸系统疾病发病率之间因果关系的流行病学推断。同时,分层统计字段使得学者能够剥离城乡因素对清洁燃料获取的影响,推动环境正义理论在低收入区域的实证检验,显著提升了非洲公共卫生研究的可重复性与跨国比较的严谨性。
实际应用
在实际应用层面,该数据集助力世界卫生组织及其合作伙伴监测《2030年可持续发展议程》中关于确保人人获得负担得起的清洁能源的具体目标进展。非政府组织和非洲各国卫生部可借助此数据,识别清洁燃料推广项目的覆盖短板,优化资金投放与补贴方案。此外,新能源初创企业亦可基于该数据集,发掘特定国家及城乡区域的市场潜力,制定差异化的清洁炉灶推广策略,从而加速非洲大陆向可持续能源体系的转型。
数据集最近研究
最新研究方向
该数据集聚焦于非洲国家清洁烹饪燃料与技术的普及率动态,是追踪联合国可持续发展目标(SDG 7.1.2)中“获得清洁烹饪燃料人口比例”的关键工具。当前前沿研究正借助该数据集的时空覆盖率(2000–2023年,47国)与分层结构(城乡、性别),结合机器学习模型预测能源转型路径,并评估室内空气污染对呼吸道疾病负担的影响。尤其在气候变化与健康公平交叉领域,该数据集为量化清洁能源推广政策在非洲的经济效益与健康效益提供了高粒度证据,助力缓解能源贫困与气候正义议题的全球对话。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务