electricsheepafrica/africa-world-bank-economy-and-growth-indicators-for-ghana
收藏Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-economy-and-growth-indicators-for-ghana
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- no-annotation
language_creators:
- found
language:
- en
license: cc-by-4.0
multilinguality:
- monolingual
size_categories:
- 10K<n<100K
source_datasets:
- original
task_categories:
- tabular-regression
task_ids: []
tags:
- africa
- humanitarian
- hdx
- electric-sheep-africa
- economics
- indicators
- gha
pretty_name: "Ghana - Economy and Growth"
dataset_info:
splits:
- name: train
num_examples: 8452
- name: test
num_examples: 2113
---
# Ghana - Economy and Growth
**Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-economy-and-growth-indicators-for-ghana) · **License:** `cc-by` · **Updated:** 2026-03-27
---
## Abstract
Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-ghana) on HDX.
Economic growth is central to economic development. When national income grows, real people benefit. While there is no known formula for stimulating economic growth, data can help policy-makers better understand their countries' economic situations and guide any work toward improvement. Data here covers measures of economic growth, such as gross domestic product (GDP) and gross national income (GNI). It also includes indicators representing factors known to be relevant to economic growth, such as capital stock, employment, investment, savings, consumption, government spending, imports, and exports.
Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **GHA**.
*Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).*
---
## Dataset Characteristics
| | |
|---|---|
| **Domain** | Humanitarian and development data |
| **Unit of observation** | Country-level aggregates |
| **Rows (total)** | 10,565 |
| **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) |
| **Train split** | 8,452 rows |
| **Test split** | 2,113 rows |
| **Geographic scope** | GHA |
| **Publisher** | World Bank Group |
| **HDX last updated** | 2026-03-27 |
---
## Variables
**Geographic** — `country_name` (Ghana), `country_iso3` (GHA), `year` (range 1960.0–2024.0).
**Outcome / Measurement** — `value` (range -56584850400.0–1168875336458.13).
**Identifier / Metadata** — `indicator_name` (Agriculture, forestry, and fishing, value added (current LCU), GDP per capita (current US$), GDP (constant 2015 US$)), `indicator_code` (NV.AGR.TOTL.CN, NY.GDP.PCAP.CD, NY.GDP.MKTP.KD), `esa_source` (HDX), `esa_processed` (2026-04-11).
---
## Quick Start
```python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-world-bank-economy-and-growth-indicators-for-ghana")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
```
---
## Schema
| Column | Type | Null % | Range / Sample Values |
|---|---|---|---|
| `country_name` | object | 0.0% | Ghana |
| `country_iso3` | object | 0.0% | GHA |
| `year` | int64 | 0.0% | 1960.0 – 2024.0 (mean 1998.2312) |
| `indicator_name` | object | 0.0% | Agriculture, forestry, and fishing, value added (current LCU), GDP per capita (current US$), GDP (constant 2015 US$) |
| `indicator_code` | object | 0.0% | NV.AGR.TOTL.CN, NY.GDP.PCAP.CD, NY.GDP.MKTP.KD |
| `value` | float64 | 0.0% | -56584850400.0 – 1168875336458.13 (mean 12008037448.9639) |
| `esa_source` | object | 0.0% | HDX |
| `esa_processed` | object | 0.0% | 2026-04-11 |
---
## Numeric Summary
| Column | Min | Max | Mean | Median |
|---|---|---|---|---|
| `year` | 1960.0 | 2024.0 | 1998.2312 | 2001.0 |
| `value` | -56584850400.0 | 1168875336458.13 | 12008037448.9639 | 23010.0 |
---
## Curation
Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet.
---
## Limitations
- Data originates from World Bank Group and has not been independently validated by ESA.
- Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection.
- Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-economy-and-growth-indicators-for-ghana) for the publisher's own methodology notes and caveats.
---
## Citation
```bibtex
@dataset{hdx_africa_world_bank_economy_and_growth_indicators_for_ghana,
title = {Ghana - Economy and Growth},
author = {World Bank Group},
year = {2026},
url = {https://data.humdata.org/dataset/world-bank-economy-and-growth-indicators-for-ghana},
note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)}
}
```
---
*[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
在经济学与发展研究领域,数据质量直接关系到政策分析与学术研究的可靠性。该数据集源自世界银行集团的官方数据门户,由Electric Sheep Africa团队通过HDX平台的CKAN API获取原始资料,并经过系统化处理转化为机器学习友好的格式。构建过程中,列名被统一转换为蛇形命名法,常见的缺失值标记如'N/A'、'null'等均被规范化为NaN值,以确保数据一致性。随后,采用固定随机种子将数据集按80:20的比例划分为训练集与测试集,并以Snappy压缩的Parquet格式存储,从而为后续建模提供了结构清晰且易于访问的数据基础。
特点
作为聚焦加纳经济增长指标的数据集,其核心特征体现在时间跨度的广度与指标维度的深度上。数据集涵盖了从1960年至2024年的国家层面聚合数据,囊括了国内生产总值、人均GDP以及农业增加值等关键经济指标,为纵向经济趋势分析提供了丰富素材。在结构上,数据集包含10,565条观测记录,分为8个变量,其中既包含年份与数值型测量值,也涵盖了指标名称与代码等分类信息,且所有字段均无缺失值,保证了数据的完整性。这种设计使得研究者能够同时进行时间序列分析与跨指标比较,深入探究加纳经济发展轨迹及其内在驱动因素。
使用方法
在应用层面,该数据集主要服务于表格回归等机器学习任务,适用于经济预测、政策效果评估等研究场景。使用者可通过Hugging Face的datasets库直接加载数据,便捷地转换为Pandas DataFrame进行操作与分析。数据已预分为训练集与测试集,便于快速构建和验证预测模型,例如基于历史经济指标预测未来增长趋势。研究者应注意到数据源自世界银行,虽经规范化处理,但原始收集过程中可能存在的定义不一致或报告偏差仍需参考官方方法论说明。建议将本数据集与更广泛的区域或全球经济数据结合使用,以深化对加纳经济发展模式的语境化理解。
背景与挑战
背景概述
在经济学与发展研究领域,宏观经济指标的时序数据对于理解国家经济增长轨迹与政策评估具有基石性意义。世界银行集团作为全球权威的发展数据机构,长期系统性地收集并发布各国经济与增长指标,为学术研究与政策分析提供了不可或缺的实证基础。本数据集由Electric Sheep Africa于2026年整理并发布,聚焦于加纳自1960年至2024年的关键经济指标,如国内生产总值、人均GDP及各产业增加值等。其核心研究问题在于通过结构化、机器学习友好的数据格式,赋能研究者深入剖析加纳的经济发展模式、增长驱动因素及其长期趋势,从而为人道主义与发展干预提供数据驱动的洞察。
当前挑战
该数据集旨在解决宏观经济预测与增长因素归因分析这一领域核心问题,其挑战在于经济指标间存在复杂的非线性相互作用与外部冲击影响,使得构建稳健的预测模型尤为困难。在数据构建过程中,挑战主要源于原始数据的异构性,包括指标定义随时间可能发生的不一致、早期数据缺失或报告误差,以及将世界银行原始数据转换为标准化表格格式时所需的数据清洗与验证工作。此外,确保跨年份数据可比性并处理极端值或负值记录,亦是构建高质量分析数据集的关键难点。
常用场景
经典使用场景
在宏观经济研究领域,该数据集为加纳的经济增长分析提供了结构化时序数据。研究者通常利用其涵盖1960年至2024年的国内生产总值、人均GDP及农业增加值等关键指标,构建时间序列模型以追踪经济增长轨迹。通过整合资本存量、就业、投资等关联变量,该数据集支持对经济增长驱动因素的量化探索,为经济预测和政策模拟奠定数据基础。
实际应用
在政策制定与国际发展实践中,该数据集被广泛应用于加纳的国家发展战略评估。政府部门可依据历史经济增长数据校准经济模型,预测政策干预效果;国际组织则借助这些指标进行跨国比较,评估援助项目的长期影响。数据中涵盖的进出口、消费等细分指标,还能为产业政策调整和贸易协定谈判提供定量参考。
衍生相关工作
基于该数据集衍生的经典研究包括对加纳经济结构转型的计量分析,以及撒哈拉以南非洲国家经济增长收敛性的比较研究。许多学者利用其构建了经济增长预测模型,并开发了结合机器学习方法的经济脆弱性评估框架。这些工作进一步催生了针对发展中国家经济指标标准化与可视化工具的开发,推动了发展经济学研究的数字化转型。
以上内容由遇见数据集搜集并总结生成



