electricsheepafrica/africa-world-bank-energy-and-mining-indicators-for-gabon
收藏Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-energy-and-mining-indicators-for-gabon
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- no-annotation
language_creators:
- found
language:
- en
license: cc-by-4.0
multilinguality:
- monolingual
size_categories:
- 1K<n<10K
source_datasets:
- original
task_categories:
- tabular-regression
task_ids: []
tags:
- africa
- humanitarian
- hdx
- electric-sheep-africa
- development
- energy
- indicators
- gab
pretty_name: "Gabon - Energy and Mining"
dataset_info:
splits:
- name: train
num_examples: 1135
- name: test
num_examples: 283
---
# Gabon - Energy and Mining
**Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-energy-and-mining-indicators-for-gabon) · **License:** `cc-by` · **Updated:** 2026-03-27
---
## Abstract
Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-gabon) on HDX.
The world economy needs ever-increasing amounts of energy to sustain economic growth, raise living standards, and reduce poverty. But today's trends in energy use are not sustainable. As the world's population grows and economies become more industrialized, nonrenewable energy sources will become scarcer and more costly. Data here on energy production, use, dependency, and efficiency are compiled by the World Bank from the International Energy Agency and the Carbon Dioxide Information Analysis Center.
Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **GAB**.
*Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).*
---
## Dataset Characteristics
| | |
|---|---|
| **Domain** | Demographics and population |
| **Unit of observation** | Country-level aggregates |
| **Rows (total)** | 1,419 |
| **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) |
| **Train split** | 1,135 rows |
| **Test split** | 283 rows |
| **Geographic scope** | GAB |
| **Publisher** | World Bank Group |
| **HDX last updated** | 2026-03-27 |
---
## Variables
**Geographic** — `country_name` (Gabon), `country_iso3` (GAB), `year` (range 1962.0–2023.0).
**Outcome / Measurement** — `value` (range -435710000.0–4747575554.9252).
**Identifier / Metadata** — `indicator_name` (Adjusted savings: natural resources depletion (% of GNI), Adjusted savings: energy depletion (% of GNI), Adjusted savings: mineral depletion (current US$)), `indicator_code` (NY.ADJ.DRES.GN.ZS, NY.ADJ.DNGY.GN.ZS, NY.ADJ.DMIN.CD), `esa_source` (HDX), `esa_processed` (2026-04-11).
---
## Quick Start
```python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-world-bank-energy-and-mining-indicators-for-gabon")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
```
---
## Schema
| Column | Type | Null % | Range / Sample Values |
|---|---|---|---|
| `country_name` | object | 0.0% | Gabon |
| `country_iso3` | object | 0.0% | GAB |
| `year` | int64 | 0.0% | 1962.0 – 2023.0 (mean 2001.3002) |
| `indicator_name` | object | 0.0% | Adjusted savings: natural resources depletion (% of GNI), Adjusted savings: energy depletion (% of GNI), Adjusted savings: mineral depletion (current US$) |
| `indicator_code` | object | 0.0% | NY.ADJ.DRES.GN.ZS, NY.ADJ.DNGY.GN.ZS, NY.ADJ.DMIN.CD |
| `value` | float64 | 0.0% | -435710000.0 – 4747575554.9252 (mean 47955010.1745) |
| `esa_source` | object | 0.0% | HDX |
| `esa_processed` | object | 0.0% | 2026-04-11 |
---
## Numeric Summary
| Column | Min | Max | Mean | Median |
|---|---|---|---|---|
| `year` | 1962.0 | 2023.0 | 2001.3002 | 2003.0 |
| `value` | -435710000.0 | 4747575554.9252 | 47955010.1745 | 19.5314 |
---
## Curation
Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet.
---
## Limitations
- Data originates from World Bank Group and has not been independently validated by ESA.
- Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection.
- Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-energy-and-mining-indicators-for-gabon) for the publisher's own methodology notes and caveats.
---
## Citation
```bibtex
@dataset{hdx_africa_world_bank_energy_and_mining_indicators_for_gabon,
title = {Gabon - Energy and Mining},
author = {World Bank Group},
year = {2026},
url = {https://data.humdata.org/dataset/world-bank-energy-and-mining-indicators-for-gabon},
note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)}
}
```
---
*[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
在能源经济学领域,数据集的构建往往依赖于权威机构的长期监测与统计。本数据集源自世界银行集团,通过其人本数据交换平台获取原始资料,涵盖了加蓬自1962年至2023年间的能源与矿产指标。数据采集过程遵循国际能源署与二氧化碳信息分析中心的标准化方法,确保了指标定义与计算口径的一致性。随后,Electric Sheep Africa团队对原始数据进行了系统化处理,包括通过CKAN API下载、统一缺失值标记为NaN、将列名转换为蛇形命名法,并最终将数据转换为Parquet格式。为适应机器学习任务,数据集按80:20的比例随机划分为训练集与测试集,采用固定随机种子以保证可复现性。
特点
该数据集聚焦于加蓬的能源与矿产领域,其核心特征体现在结构化的时间序列与多维指标上。数据集包含1,419条国家层面的聚合记录,涵盖三个关键指标:自然资源耗减调整储蓄占国民总收入百分比、能源耗减调整储蓄占国民总收入百分比,以及矿产耗减调整储蓄的当前美元价值。这些指标通过标准化的代码进行标识,便于跨数据库的对照与分析。数据的时间跨度长达62年,为研究长期趋势提供了丰富的历史维度。在技术层面,数据集已预先划分为训练集与测试集,并以Snappy压缩的Parquet格式存储,确保了高效的数据读取与处理效率,同时所有字段均无缺失值,提升了数据的完整性与可靠性。
使用方法
在应用层面,该数据集主要服务于表格回归等机器学习任务,适用于能源经济、资源可持续性及发展政策的研究。使用者可通过Hugging Face的datasets库直接加载数据集,利用Python环境快速访问训练与测试分区。加载后的数据可便捷地转换为Pandas DataFrame,以便进行探索性数据分析、特征工程或模型训练。鉴于数据集已包含标准化的指标代码与年份信息,研究者可轻松构建时间序列模型,分析能源与矿产耗减对国民经济的历史影响与未来预测。同时,数据集的原始出处与处理方法均有明确记载,为学术引用与方法论追溯提供了完整依据,支持透明、可复现的科学研究流程。
背景与挑战
背景概述
在全球化经济背景下,能源与矿产资源的可持续管理已成为各国发展战略的核心议题。世界银行集团于2026年发布了加蓬能源与矿业指标数据集,旨在系统追踪该国自1962年至2023年间自然资源消耗、能源依赖及矿产开发等关键经济指标。该数据集由Electric Sheep Africa团队进行机器学习友好型重构,聚焦于加蓬这一典型资源依赖型经济体,为研究资源诅咒理论、环境经济学以及可持续发展政策提供了高质量的时序数据基础。其核心研究问题在于量化自然资源开发对国民总收入的影响,从而辅助国际组织与地方政府制定平衡经济增长与生态保护的政策框架。
当前挑战
该数据集致力于解决资源经济学中资源消耗与经济发展脱钩的量化评估挑战,具体涉及能源耗竭、矿产枯竭及自然资本折旧等复杂指标的精确测算。在构建过程中,数据整合面临多重困难:原始数据来源于国际能源署与二氧化碳信息分析中心,不同机构间的统计口径与定义可能存在差异,导致指标一致性难以保证;同时,跨越六十余年的历史数据存在报告缺失、数值异常(如负值记录)及计量单位不统一等问题,需通过自动化清洗流程进行标准化处理,但无法修正原始收集阶段的系统性偏差或定义矛盾。此外,数据集仅涵盖国家层面聚合数据,缺乏区域或行业细分,限制了微观机制分析的深度。
常用场景
经典使用场景
在能源经济学与发展研究领域,该数据集作为加蓬国家层面的能源与矿产指标时间序列集合,常被用于构建回归模型以分析自然资源依赖与经济增长之间的动态关系。研究者利用其涵盖1962年至2023年的年度数据,通过指标如调整后储蓄中的能源耗竭占比,评估资源开采对国民总收入的结构性影响,为理解资源丰富型经济体的可持续发展路径提供实证基础。
解决学术问题
该数据集有效解决了发展经济学中关于‘资源诅咒’假说的量化验证难题,通过提供标准化的能源与矿产耗竭指标,使学者能够精确测算自然资源依赖对宏观经济稳定的长期效应。其意义在于填补了加蓬这类中非国家的高质量时序数据空白,促进了跨区域比较研究,并为政策评估提供了可靠的基准数据,推动了资源管理领域的实证研究进展。
衍生相关工作
围绕该数据集衍生的经典工作包括世界银行发布的《非洲资源治理报告》中针对加蓬的国别分析,以及多项学术研究利用其指标构建面板数据模型,探讨资源依赖与人力资本发展的关联。此外,机器学习领域的研究者将其作为时序预测任务的基准,开发了用于资源价格波动与宏观经济变量预测的算法,拓展了发展数据在人工智能中的应用边界。
以上内容由遇见数据集搜集并总结生成



