electricsheepafrica/africa-world-bank-financial-sector-indicators-for-ghana
收藏Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-financial-sector-indicators-for-ghana
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- no-annotation
language_creators:
- found
language:
- en
license: cc-by-4.0
multilinguality:
- monolingual
size_categories:
- 1K<n<10K
source_datasets:
- original
task_categories:
- tabular-regression
- other
task_ids: []
tags:
- africa
- humanitarian
- hdx
- electric-sheep-africa
- economics
- indicators
- gha
pretty_name: "Ghana - Financial Sector"
dataset_info:
splits:
- name: train
num_examples: 3278
- name: test
num_examples: 819
---
# Ghana - Financial Sector
**Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-financial-sector-indicators-for-ghana) · **License:** `cc-by` · **Updated:** 2026-03-27
---
## Abstract
Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-ghana) on HDX.
An economy's financial markets are critical to its overall development. Banking systems and stock markets enhance growth, the main factor in poverty reduction. Strong financial systems provide reliable and accessible information that lowers transaction costs, which in turn bolsters resource allocation and economic growth. Indicators here include the size and liquidity of stock markets; the accessibility, stability, and efficiency of financial systems; and international migration and workers\ remittances, which affect growth and social welfare in both sending and receiving countries.
Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **GHA**.
*Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).*
---
## Dataset Characteristics
| | |
|---|---|
| **Domain** | Poverty and economic vulnerability |
| **Unit of observation** | Country-level aggregates |
| **Rows (total)** | 4,098 |
| **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) |
| **Train split** | 3,278 rows |
| **Test split** | 819 rows |
| **Geographic scope** | GHA |
| **Publisher** | World Bank Group |
| **HDX last updated** | 2026-03-27 |
---
## Variables
**Geographic** — `country_name` (Ghana), `country_iso3` (GHA), `year` (range 1960.0–2025.0).
**Outcome / Measurement** — `value` (range -11346855667.2638–3125280063460.0).
**Identifier / Metadata** — `indicator_name` (Domestic credit to private sector (% of GDP), Net migration, Official exchange rate (LCU per US$, period average)), `indicator_code` (SM.POP.NETM, PA.NUS.ATLS, PA.NUS.FCRF), `esa_source` (HDX), `esa_processed` (2026-04-11).
---
## Quick Start
```python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-world-bank-financial-sector-indicators-for-ghana")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
```
---
## Schema
| Column | Type | Null % | Range / Sample Values |
|---|---|---|---|
| `country_name` | object | 0.0% | Ghana |
| `country_iso3` | object | 0.0% | GHA |
| `year` | int64 | 0.0% | 1960.0 – 2025.0 (mean 1999.0939) |
| `indicator_name` | object | 0.0% | Domestic credit to private sector (% of GDP), Net migration, Official exchange rate (LCU per US$, period average) |
| `indicator_code` | object | 0.0% | SM.POP.NETM, PA.NUS.ATLS, PA.NUS.FCRF |
| `value` | float64 | 0.0% | -11346855667.2638 – 3125280063460.0 (mean 3151922534.9236) |
| `esa_source` | object | 0.0% | HDX |
| `esa_processed` | object | 0.0% | 2026-04-11 |
---
## Numeric Summary
| Column | Min | Max | Mean | Median |
|---|---|---|---|---|
| `year` | 1960.0 | 2025.0 | 1999.0939 | 2003.0 |
| `value` | -11346855667.2638 | 3125280063460.0 | 3151922534.9236 | 13.2707 |
---
## Curation
Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet.
---
## Limitations
- Data originates from World Bank Group and has not been independently validated by ESA.
- Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection.
- Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-financial-sector-indicators-for-ghana) for the publisher's own methodology notes and caveats.
---
## Citation
```bibtex
@dataset{hdx_africa_world_bank_financial_sector_indicators_for_ghana,
title = {Ghana - Financial Sector},
author = {World Bank Group},
year = {2026},
url = {https://data.humdata.org/dataset/world-bank-financial-sector-indicators-for-ghana},
note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)}
}
```
---
*[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
annotations_creators:
- 无注释
language_creators:
- 公开采集
language:
- 英语
license: cc-by-4.0
multilinguality:
- 单语言
size_categories:
- 1K<n<10K
source_datasets:
- 原始数据集
task_categories:
- 表格回归
- 其他
task_ids: []
tags:
- 非洲
- 人道主义
- 人类数据交换平台(HDX)
- 非洲电羊(Electric Sheep Africa)
- 经济学
- 经济指标
- 加纳(GHA)
pretty_name: "加纳——金融部门"
dataset_info:
splits:
- name: train
num_examples: 3278
- name: test
num_examples: 819
# 加纳——金融部门
**发布方:** 世界银行集团(World Bank Group) · **数据源:** [人类数据交换平台(HDX)](https://data.humdata.org/dataset/world-bank-financial-sector-indicators-for-ghana) · **许可协议:** `cc-by` · **最后更新时间:** 2026-03-27
---
## 摘要
本数据集包含来自世界银行[数据门户](http://data.worldbank.org/)的相关数据。人类数据交换平台(HDX)上还提供了一份[整合后的国家数据集](https://data.humdata.org/dataset/world-bank-combined-indicators-for-ghana)。
经济体的金融市场对其整体发展至关重要。银行体系与股票市场能够促进经济增长,而经济增长是减贫的核心因素。健全的金融体系能够提供可靠且易于获取的信息,降低交易成本,进而优化资源配置并推动经济增长。本数据集包含的指标涵盖股票市场的规模与流动性、金融体系的可及性、稳定性与效率,以及国际移民与劳工汇款——这类因素会对移民输出国与接收国的经济增长及社会福利产生影响。
本数据集的每一行均代表国家层面的汇总数据。本数据集在人类数据交换平台(HDX)的最后更新时间为2026-03-27。地理覆盖范围:**加纳(GHA)**。
*本数据集已由[非洲电羊(Electric Sheep Africa)](https://huggingface.co/electricsheepafrica)整理为可供机器学习直接使用的帕奎特格式(Parquet)。*
---
## 数据集特征
| | |
|---|---|
| **研究领域** | 贫困与经济脆弱性 |
| **观测单元** | 国家层面汇总数据 |
| **总行数** | 4098 |
| **列数** | 8(2个数值型,6个分类型,0个日期型) |
| **训练集划分** | 3278条数据 |
| **测试集划分** | 819条数据 |
| **地理覆盖范围** | 加纳(GHA) |
| **发布方** | 世界银行集团 |
| **HDX平台最后更新时间** | 2026-03-27 |
---
## 变量
**地理类变量** — `country_name`(国家名称:加纳)、`country_iso3`(国家ISO3代码:加纳(GHA))、`year`(年份:范围1960.0–2025.0)。
**结果/测量类变量** — `value`(指标数值:范围-11346855667.2638–3125280063460.0)。
**标识符/元数据类变量** — `indicator_name`(指标名称:私人部门国内信贷占GDP百分比、净移民人数、官方汇率(当地货币兑美元,当期平均))、`indicator_code`(指标代码:SM.POP.NETM、PA.NUS.ATLS、PA.NUS.FCRF)、`esa_source`(数据来源:HDX)、`esa_processed`(数据处理时间:2026-04-11)。
---
## 快速上手
python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-world-bank-financial-sector-indicators-for-ghana")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
---
## 数据结构
| 列名 | 数据类型 | 空值占比 | 取值范围/示例值 |
|---|---|---|---|
| `country_name` | 字符串型 | 0.0% | 加纳 |
| `country_iso3` | 字符串型 | 0.0% | 加纳(GHA) |
| `year` | 64位整型 | 0.0% | 1960.0 – 2025.0(均值1999.0939) |
| `indicator_name` | 字符串型 | 0.0% | 私人部门国内信贷占GDP百分比、净移民人数、官方汇率(当地货币兑美元,当期平均) |
| `indicator_code` | 字符串型 | 0.0% | SM.POP.NETM、PA.NUS.ATLS、PA.NUS.FCRF |
| `value` | 64位浮点型 | 0.0% | -11346855667.2638 – 3125280063460.0(均值3151922534.9236) |
| `esa_source` | 字符串型 | 0.0% | HDX |
| `esa_processed` | 字符串型 | 0.0% | 2026-04-11 |
---
## 数值统计摘要
| 列名 | 最小值 | 最大值 | 均值 | 中位数 |
|---|---|---|---|---|
| `year` | 1960.0 | 2025.0 | 1999.0939 | 2003.0 |
| `value` | -11346855667.2638 | 3125280063460.0 | 3151922534.9236 | 13.2707 |
---
## 数据整理流程
原始数据通过CKAN API(CKAN API)从HDX平台下载,并转换为帕奎特格式(Parquet)。对列名进行了小写转换与蛇形命名法标准化处理。将常见的缺失值标记(`N/A`、`null`、`none`、`-`、`unknown`、`no data`、`#N/A`)统一替换为`NaN`。本数据集采用固定随机种子(42)按照80/20的比例划分为训练集与测试集,并保存为Snappy压缩(Snappy)的帕奎特格式(Parquet)文件。
---
## 局限性
- 本数据集原始数据来源于世界银行集团,未经过非洲电羊(ESA)的独立验证。
- 自动化清洗流程无法修正原始数据收集过程中存在的错报值、定义不一致或抽样偏差问题。
- 如需了解发布方的方法论说明与注意事项,请参阅[原始HDX数据集页面](https://data.humdata.org/dataset/world-bank-financial-sector-indicators-for-ghana)。
---
## 引用格式
bibtex
@dataset{hdx_africa_world_bank_financial_sector_indicators_for_ghana,
title = {Ghana - Financial Sector},
author = {World Bank Group},
year = {2026},
url = {https://data.humdata.org/dataset/world-bank-financial-sector-indicators-for-ghana},
note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)}
}
---
*[非洲电羊(Electric Sheep Africa)](https://huggingface.co/electricsheepafrica) — 非洲机器学习数据集基础设施。尼日利亚拉各斯。*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
在金融经济学领域,数据集的构建往往依赖于权威机构的系统性收集与整理。本数据集源于世界银行集团的数据门户,由Electric Sheep Africa团队通过HDX平台的CKAN API获取原始数据,并进行了精心的预处理。原始数据经过标准化处理,包括列名的小写与蛇形命名转换,以及常见缺失值标记的统一化。随后,数据集按照80/20的比例,通过固定随机种子划分为训练集与测试集,最终以Snappy压缩的Parquet格式存储,确保了数据的机器学习就绪性。
特点
该数据集聚焦于加纳的金融部门指标,涵盖了从1960年至2025年的国家层面聚合数据。其核心特征体现在多维度的金融与经济变量上,例如国内私营部门信贷占GDP的百分比、净迁移以及官方汇率等。数据集包含4098条观测记录,每条记录均具有8个特征列,其中2列为数值型,6列为分类型,且无缺失值,保证了数据的完整性与一致性。地理范围严格限定于加纳,为区域经济研究提供了高度针对性的数据支持。
使用方法
对于研究人员而言,该数据集可直接应用于表格回归等机器学习任务。通过Hugging Face的datasets库,用户可以便捷地加载数据,并将其转换为Pandas DataFrame以进行后续分析。数据已预分为训练集与测试集,便于模型训练与评估。在使用过程中,建议参考原始HDX页面中的方法论说明,并注意数据源自世界银行集团,其准确性依赖于原始收集过程,需结合领域知识进行审慎解读与验证。
背景与挑战
背景概述
金融部门指标数据集作为衡量国家经济发展与金融体系健康程度的核心工具,其构建与应用对于理解经济动态具有深远意义。世界银行集团作为全球重要的经济数据发布机构,长期致力于收集与整理各国金融领域的宏观指标。该数据集聚焦于加纳,涵盖了从1960年至2025年间的关键金融指标,如私人部门信贷占GDP比重、净移民数量以及官方汇率等,由Electric Sheep Africa于2026年进行机器学习友好型重构。这些数据不仅为研究者提供了分析加纳金融体系演变与经济增长关联的实证基础,也在推动非洲区域经济政策制定与减贫战略方面发挥了重要作用。
当前挑战
该数据集旨在解决金融经济领域的回归与预测问题,其核心挑战在于如何从高度异质且跨时段的宏观指标中提取稳健的经济洞察。具体而言,指标间存在显著的尺度差异与数值范围波动,例如价值列的最小值与最大值跨越了极端区间,这给模型训练带来了归一化与异常值处理的难题。在构建过程中,数据源自世界银行集团的原始收集,面临定义不一致、报告偏差以及历史数据缺失等固有局限;尽管经过自动化清洗与格式统一,但原始数据中的误报值与采样偏差无法被完全校正,这要求使用者在应用时需结合领域知识进行审慎验证。
常用场景
经典使用场景
在金融经济学与发展研究领域,该数据集为分析加纳金融部门动态提供了结构化时序数据。研究者通常利用其包含的国内信贷占比、净迁移率及官方汇率等指标,构建时间序列模型或面板回归分析,以揭示金融深化与经济增长之间的长期关联。这些指标跨越1960年至2025年,为追踪加纳金融体系演变及其对宏观经济的影响奠定了实证基础。
实际应用
在实际应用中,该数据集被政策制定者与国际组织用于监测加纳金融部门的健康状况。例如,国内信贷占GDP比例可用于评估私营部门的融资环境,而汇率数据则辅助央行进行汇率政策调整。这些指标也被纳入国家发展战略评估框架,帮助设计针对性的金融包容性项目,以促进经济稳定与可持续发展。
衍生相关工作
基于该数据集衍生的经典工作主要集中在金融发展与经济增长的实证研究领域。学者们利用其构建了加纳金融深度指数,并与其他宏观经济变量进行耦合分析,发表了多篇关于金融部门改革效果评估的学术论文。此外,该数据常被整合进跨国比较研究,作为非洲地区金融指标标准化的重要组成部分,推动了区域经济一体化政策的制定。
以上内容由遇见数据集搜集并总结生成



