electricsheepafrica/africa-world-bank-private-sector-indicators-for-ghana
收藏Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-private-sector-indicators-for-ghana
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- no-annotation
language_creators:
- found
language:
- en
license: cc-by-4.0
multilinguality:
- monolingual
size_categories:
- 1K<n<10K
source_datasets:
- original
task_categories:
- tabular-regression
task_ids: []
tags:
- africa
- humanitarian
- hdx
- electric-sheep-africa
- economics
- indicators
- gha
pretty_name: "Ghana - Private Sector"
dataset_info:
splits:
- name: train
num_examples: 3215
- name: test
num_examples: 803
---
# Ghana - Private Sector
**Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-private-sector-indicators-for-ghana) · **License:** `cc-by` · **Updated:** 2026-03-27
---
## Abstract
Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-ghana) on HDX.
Private markets drive economic growth, tapping initiative and investment to create productive jobs and raise incomes. Trade is also a driver of economic growth as it integrates developing countries into the world economy and generates benefits for their people. Data on the private sector and trade are from the World Bank Group's Private Participation in Infrastructure Project Database, Enterprise Surveys, and Doing Business Indicators, as well as from the International Monetary Fund's Balance of Payments database and International Financial Statistics, the UN Commission on Trade and Development, the World Trade Organization, and various other sources.
Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **GHA**.
*Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).*
---
## Dataset Characteristics
| | |
|---|---|
| **Domain** | Market and price monitoring |
| **Unit of observation** | Country-level aggregates |
| **Rows (total)** | 4,019 |
| **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) |
| **Train split** | 3,215 rows |
| **Test split** | 803 rows |
| **Geographic scope** | GHA |
| **Publisher** | World Bank Group |
| **HDX last updated** | 2026-03-27 |
---
## Variables
**Geographic** — `country_name` (Ghana), `country_iso3` (GHA), `year` (range 1960.0–2024.0).
**Outcome / Measurement** — `value` (range -0.0–20221000000.0).
**Identifier / Metadata** — `indicator_name` (Merchandise trade (% of GDP), Merchandise exports (current US$), Merchandise imports (current US$)), `indicator_code` (TG.VAL.TOTL.GD.ZS, TX.VAL.MRCH.CD.WT, TM.VAL.MRCH.CD.WT), `esa_source` (HDX), `esa_processed` (2026-04-11).
---
## Quick Start
```python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-world-bank-private-sector-indicators-for-ghana")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
```
---
## Schema
| Column | Type | Null % | Range / Sample Values |
|---|---|---|---|
| `country_name` | object | 0.0% | Ghana |
| `country_iso3` | object | 0.0% | GHA |
| `year` | int64 | 0.0% | 1960.0 – 2024.0 (mean 1997.6865) |
| `indicator_name` | object | 0.0% | Merchandise trade (% of GDP), Merchandise exports (current US$), Merchandise imports (current US$) |
| `indicator_code` | object | 0.0% | TG.VAL.TOTL.GD.ZS, TX.VAL.MRCH.CD.WT, TM.VAL.MRCH.CD.WT |
| `value` | float64 | 0.0% | -0.0 – 20221000000.0 (mean 359765628.639) |
| `esa_source` | object | 0.0% | HDX |
| `esa_processed` | object | 0.0% | 2026-04-11 |
---
## Numeric Summary
| Column | Min | Max | Mean | Median |
|---|---|---|---|---|
| `year` | 1960.0 | 2024.0 | 1997.6865 | 2001.0 |
| `value` | -0.0 | 20221000000.0 | 359765628.639 | 12.0341 |
---
## Curation
Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet.
---
## Limitations
- Data originates from World Bank Group and has not been independently validated by ESA.
- Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection.
- Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-private-sector-indicators-for-ghana) for the publisher's own methodology notes and caveats.
---
## Citation
```bibtex
@dataset{hdx_africa_world_bank_private_sector_indicators_for_ghana,
title = {Ghana - Private Sector},
author = {World Bank Group},
year = {2026},
url = {https://data.humdata.org/dataset/world-bank-private-sector-indicators-for-ghana},
note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)}
}
```
---
*[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
在经济学研究领域,私营部门与贸易数据是评估国家经济发展态势的关键要素。该数据集由世界银行集团整合多方权威数据源构建而成,涵盖基础设施私人参与项目数据库、企业调查、营商环境指标以及国际货币基金组织的国际收支统计等。原始数据通过HDX平台获取,并由Electric Sheep Africa团队进行标准化处理,包括统一缺失值标记、规范列名格式,并按照80:20的比例划分训练集与测试集,最终以Parquet格式封装,确保数据可直接应用于机器学习流程。
使用方法
为便于研究者快速开展实证分析,数据集已预分为训练集与测试集,用户可通过Hugging Face的datasets库直接加载。加载后,数据可转换为Pandas DataFrame进行后续处理,适用于回归建模、时间序列分析或经济指标预测等任务。使用者需注意数据源自世界银行,虽经清洗但未经验证,建议参考原始发布方的方法说明以理解潜在局限,确保分析结论的稳健性。
背景与挑战
背景概述
加纳私营部门指标数据集由世界银行集团于2026年发布,并由Electric Sheep Africa机构重新整理为机器学习友好格式。该数据集聚焦于发展经济学与私营部门研究领域,核心在于量化分析加纳的私营经济活动与贸易表现。通过整合世界银行基础设施私人参与数据库、企业调查、营商环境指标以及国际货币基金组织等多源数据,该数据集系统收录了1960年至2024年间加纳在商品贸易占GDP比重、商品进出口额等关键指标的国家级聚合数据。其创建旨在为研究人员和政策制定者提供长期、连贯的时序数据,以评估私营部门在驱动经济增长、促进就业与收入提升方面的作用,从而支持对发展中国家经济转型路径的实证研究。
当前挑战
该数据集致力于解决宏观经济指标预测与政策评估中的挑战,特别是如何在多源异构的经济统计数据中构建可靠、一致的跨国或跨时序比较基准。其核心挑战在于原始数据本身可能存在报告偏差、定义不一致或采样局限,例如不同国际组织在指标计算方法上的差异可能导致数据可比性降低。在构建过程中,数据清洗面临统一缺失值标记与标准化字段的复杂性,但自动化流程难以修正源数据中的误报或方法论不一致问题。此外,数据集作为国家层面聚合数据,无法揭示微观层面的异质性,限制了其对私营部门内部结构动态的深入分析。
常用场景
经典使用场景
在非洲经济发展研究领域,该数据集为分析加纳私营部门与贸易动态提供了结构化时序数据。研究者通常利用其涵盖1960年至2024年的国家层面聚合指标,如商品贸易占GDP比重、进出口额等,构建计量经济模型以揭示私营部门增长与宏观经济变量间的长期关联。这些数据经过机器学习就绪格式处理,便于直接应用于回归任务,支持对加纳经济转型轨迹的实证探索。
解决学术问题
该数据集有效应对了发展经济学中关于私营部门驱动力的量化研究挑战。通过整合世界银行等多源机构的标准化指标,它帮助学者克服了非洲国家历史经济数据碎片化的问题,使得系统评估贸易开放度、私营投资与经济增长的因果关系成为可能。其时间跨度覆盖半个多世纪,为识别结构性变化和政策干预效果提供了稳健的经验证据基础。
实际应用
在实际政策制定与投资决策中,该数据集常被国际组织、政府智库及市场分析机构用于监测加纳私营部门发展态势。例如,依据商品贸易数据可评估经济对外依存度,辅助设计贸易促进策略;企业调查指标则能揭示营商环境的变迁,为投资者提供风险评估依据。这些应用直接支撑了针对非洲新兴市场的精准发展干预与资源配置。
数据集最近研究
最新研究方向
在非洲经济研究领域,加纳私营部门指标数据集正成为探索新兴市场发展轨迹的关键资源。学者们借助机器学习技术,深入分析贸易依存度与经济增长之间的动态关联,尤其关注商品贸易占GDP比重等指标对经济结构转型的启示。随着非洲大陆自由贸易区的推进,该数据集为评估区域一体化政策效果提供了实证基础,助力构建更精准的发展预测模型。这些研究不仅揭示了外部冲击下经济韧性的形成机制,也为跨国投资决策提供了数据驱动的洞察。
以上内容由遇见数据集搜集并总结生成



