electricsheepafrica/africa-world-bank-public-sector-indicators-for-gabon
收藏Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-public-sector-indicators-for-gabon
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- no-annotation
language_creators:
- found
language:
- en
license: cc-by-4.0
multilinguality:
- monolingual
size_categories:
- 1K<n<10K
source_datasets:
- original
task_categories:
- tabular-classification
task_ids: []
tags:
- africa
- humanitarian
- hdx
- electric-sheep-africa
- economics
- indicators
- gab
pretty_name: "Gabon - Public Sector"
dataset_info:
splits:
- name: train
num_examples: 1345
- name: test
num_examples: 336
---
# Gabon - Public Sector
**Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-public-sector-indicators-for-gabon) · **License:** `cc-by` · **Updated:** 2026-03-27
---
## Abstract
Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-gabon) on HDX.
Effective governments improve people's standard of living by ensuring access to essential services – health, education, water and sanitation, electricity, transport – and the opportunity to live and work in peace and security. Data here includes World Bank staff assessments of country performance in economic management, structural policies, policies for social inclusion and equity, and public sector management and institutions for the poorest countries. Also included are indicators on revenues and expenses from the International Monetary Fund's Government Finance Statistics, and on tax policies from various sources.
Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **GAB**.
*Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).*
---
## Dataset Characteristics
| | |
|---|---|
| **Domain** | Public health |
| **Unit of observation** | Country-level aggregates |
| **Rows (total)** | 1,682 |
| **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) |
| **Train split** | 1,345 rows |
| **Test split** | 336 rows |
| **Geographic scope** | GAB |
| **Publisher** | World Bank Group |
| **HDX last updated** | 2026-03-27 |
---
## Variables
**Geographic** — `country_name` (Gabon), `country_iso3` (GAB), `year` (range 1961.0–2024.0).
**Outcome / Measurement** — `value` (range -399090935100.0–2611727254000.0).
**Identifier / Metadata** — `indicator_name` (Military expenditure (current LCU), Military expenditure (current USD), Military expenditure (% of GDP)), `indicator_code` (MS.MIL.XPND.CN, MS.MIL.XPND.CD, MS.MIL.XPND.GD.ZS), `esa_source` (HDX), `esa_processed` (2026-04-11).
---
## Quick Start
```python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-world-bank-public-sector-indicators-for-gabon")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
```
---
## Schema
| Column | Type | Null % | Range / Sample Values |
|---|---|---|---|
| `country_name` | object | 0.0% | Gabon |
| `country_iso3` | object | 0.0% | GAB |
| `year` | int64 | 0.0% | 1961.0 – 2024.0 (mean 2010.6724) |
| `indicator_name` | object | 0.0% | Military expenditure (current LCU), Military expenditure (current USD), Military expenditure (% of GDP) |
| `indicator_code` | object | 0.0% | MS.MIL.XPND.CN, MS.MIL.XPND.CD, MS.MIL.XPND.GD.ZS |
| `value` | float64 | 0.0% | -399090935100.0 – 2611727254000.0 (mean 50215278396.4515) |
| `esa_source` | object | 0.0% | HDX |
| `esa_processed` | object | 0.0% | 2026-04-11 |
---
## Numeric Summary
| Column | Min | Max | Mean | Median |
|---|---|---|---|---|
| `year` | 1961.0 | 2024.0 | 2010.6724 | 2013.0 |
| `value` | -399090935100.0 | 2611727254000.0 | 50215278396.4515 | 17.2464 |
---
## Curation
Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet.
---
## Limitations
- Data originates from World Bank Group and has not been independently validated by ESA.
- Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection.
- Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-public-sector-indicators-for-gabon) for the publisher's own methodology notes and caveats.
---
## Citation
```bibtex
@dataset{hdx_africa_world_bank_public_sector_indicators_for_gabon,
title = {Gabon - Public Sector},
author = {World Bank Group},
year = {2026},
url = {https://data.humdata.org/dataset/world-bank-public-sector-indicators-for-gabon},
note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)}
}
```
---
*[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
在公共部门治理与经济发展研究领域,数据质量与标准化处理是确保分析可靠性的基石。本数据集源自世界银行集团发布的公开数据,通过人道主义数据交换平台获取原始资料。构建过程中,Electric Sheep Africa团队运用自动化流程,从HDX经由CKAN API下载数据,并执行了系统的数据清洗与转换。具体操作包括将列名统一为蛇形命名法,将各类缺失值标记规范化为NaN,最终将数据转换为Snappy压缩的Parquet格式,以优化机器学习应用的读取效率。数据集按80:20的比例,使用固定随机种子划分为训练集与测试集,确保了分割的可复现性。
特点
该数据集聚焦于加蓬的公共部门指标,为宏观经济与公共治理研究提供了精细化的观测视角。其核心特征体现在数据结构与内容维度上:数据集包含1,682条国家层面的聚合记录,涵盖1961年至2024年的时序数据,完整刻画了该国超过半个世纪的军事支出演变。数据维度包括8个字段,其中包含标识国家、年份的元数据,以及具体的指标名称、代码与数值。指标专门围绕军事支出展开,涵盖本地货币单位、美元计值及其占GDP比重三个关键度量,为分析国防财政负担与经济结构关系提供了连贯的序列。所有字段均无缺失值,数据完整性高,且经过标准化处理,可直接应用于机器学习模型的训练与评估。
使用方法
对于致力于发展经济学或公共政策机器学习模型的研究者而言,本数据集提供了即用型的数据接入方案。使用者可通过Hugging Face的`datasets`库直接加载,快速获取已分割的训练集与测试集。加载后,数据可便捷地转换为Pandas DataFrame,以进行探索性数据分析或特征工程。鉴于其表格分类的任务属性,该数据集适用于构建预测模型,例如基于历史指标预测未来财政趋势,或进行跨年份的模式分类研究。在实际应用中,研究者应结合原始发布方的方法论说明,审慎理解指标定义与收集背景,以确保分析结论的稳健性。数据集的标准化格式与清晰结构,显著降低了数据预处理负担,使研究者能更专注于模型开发与假设检验。
背景与挑战
背景概述
在公共管理与经济发展研究领域,量化评估国家公共部门效能是理解政府治理与资源配置的关键。世界银行集团作为国际发展机构,长期致力于构建全球性指标数据库,以监测各国在经济管理、结构性政策及社会包容性等方面的表现。该数据集由世界银行于2026年发布,并由Electric Sheep Africa机构重新整理为机器学习可用格式,聚焦于加蓬的公共部门指标,涵盖军事支出等关键财政数据。其核心研究问题在于通过时序性国家层面聚合数据,揭示公共财政与政策效能的演变轨迹,为发展经济学与公共政策分析提供实证基础,对非洲区域研究及国际比较具有重要参考价值。
当前挑战
该数据集旨在解决公共部门效能评估与财政指标分析领域的挑战,具体涉及如何从复杂多维的宏观经济数据中提取可解释模式,以支持政策决策。构建过程中面临多重挑战:原始数据来源于世界银行,可能存在报告不一致、定义差异或采样偏差,自动化清洗难以纠正深层数据质量问题;指标范围较为有限,仅涵盖军事支出相关变量,可能无法全面反映公共部门整体表现;此外,数据集仅包含加蓬单一国家的信息,其结论的普适性与跨区域比较能力受到制约,要求研究者在应用时审慎考虑地域特异性与数据局限性。
常用场景
经典使用场景
在公共部门经济学与发展研究领域,该数据集提供了加蓬国家层面的军事支出指标,涵盖本地货币、美元及占GDP百分比等维度。研究人员常利用此类结构化时间序列数据,构建回归模型或面板数据分析框架,以探究国防开支与宏观经济变量间的动态关联。通过机器学习方法如分类或预测建模,学者能够从历史趋势中识别模式,评估财政资源配置效率,为政策模拟提供量化基础。
实际应用
在实际政策制定与国际合作中,该数据集被世界银行、国际货币基金组织等机构用于国别绩效评估与援助效果监测。政府部门可依据历史支出数据优化预算分配,而民间社会组织则借助这些指标推动公共财政问责。在人道主义行动中,军事开支占比分析有助于冲突预防与稳定建设,为区域安全治理提供数据驱动的决策支持。
衍生相关工作
基于此类公共部门指标数据集,学术界已衍生出多项经典研究,例如利用面板向量自回归模型分析国防开支对非洲国家人力资本积累的影响,以及通过机器学习算法预测财政可持续性风险。相关成果常见于《Journal of Development Economics》等期刊,推动了“治理指标机器学习”子领域的形成,为自动化政策评估工具的开发奠定了数据基础。
以上内容由遇见数据集搜集并总结生成



