five

electricsheepafrica/africa-world-bank-financial-sector-indicators-for-gambia-the

收藏
Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-financial-sector-indicators-for-gambia-the
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - no-annotation language_creators: - found language: - en license: cc-by-4.0 multilinguality: - monolingual size_categories: - 1K<n<10K source_datasets: - original task_categories: - tabular-regression - other task_ids: [] tags: - africa - humanitarian - hdx - electric-sheep-africa - economics - indicators - gmb pretty_name: "Gambia, The - Financial Sector" dataset_info: splits: - name: train num_examples: 2571 - name: test num_examples: 642 --- # Gambia, The - Financial Sector **Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-financial-sector-indicators-for-gambia-the) · **License:** `cc-by` · **Updated:** 2026-03-27 --- ## Abstract Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-gambia-the) on HDX. An economy's financial markets are critical to its overall development. Banking systems and stock markets enhance growth, the main factor in poverty reduction. Strong financial systems provide reliable and accessible information that lowers transaction costs, which in turn bolsters resource allocation and economic growth. Indicators here include the size and liquidity of stock markets; the accessibility, stability, and efficiency of financial systems; and international migration and workers\ remittances, which affect growth and social welfare in both sending and receiving countries. Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **GMB**. *Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).* --- ## Dataset Characteristics | | | |---|---| | **Domain** | Poverty and economic vulnerability | | **Unit of observation** | Country-level aggregates | | **Rows (total)** | 3,214 | | **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) | | **Train split** | 2,571 rows | | **Test split** | 642 rows | | **Geographic scope** | GMB | | **Publisher** | World Bank Group | | **HDX last updated** | 2026-03-27 | --- ## Variables **Geographic** — `country_name` (Gambia, The), `country_iso3` (GMB), `year` (range 1960.0–2025.0). **Outcome / Measurement** — `value` (range -498460186.3954–70808699766.77). **Identifier / Metadata** — `indicator_name` (Domestic credit to private sector (% of GDP), Net migration, Official exchange rate (LCU per US$, period average)), `indicator_code` (SM.POP.NETM, PA.NUS.FCRF, PA.NUS.ATLS), `esa_source` (HDX), `esa_processed` (2026-04-11). --- ## Quick Start ```python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-world-bank-financial-sector-indicators-for-gambia-the") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() ``` --- ## Schema | Column | Type | Null % | Range / Sample Values | |---|---|---|---| | `country_name` | object | 0.0% | Gambia, The | | `country_iso3` | object | 0.0% | GMB | | `year` | int64 | 0.0% | 1960.0 – 2025.0 (mean 1997.8902) | | `indicator_name` | object | 0.0% | Domestic credit to private sector (% of GDP), Net migration, Official exchange rate (LCU per US$, period average) | | `indicator_code` | object | 0.0% | SM.POP.NETM, PA.NUS.FCRF, PA.NUS.ATLS | | `value` | float64 | 0.0% | -498460186.3954 – 70808699766.77 (mean 345656384.9787) | | `esa_source` | object | 0.0% | HDX | | `esa_processed` | object | 0.0% | 2026-04-11 | --- ## Numeric Summary | Column | Min | Max | Mean | Median | |---|---|---|---|---| | `year` | 1960.0 | 2025.0 | 1997.8902 | 2000.0 | | `value` | -498460186.3954 | 70808699766.77 | 345656384.9787 | 14.3971 | --- ## Curation Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet. --- ## Limitations - Data originates from World Bank Group and has not been independently validated by ESA. - Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection. - Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-financial-sector-indicators-for-gambia-the) for the publisher's own methodology notes and caveats. --- ## Citation ```bibtex @dataset{hdx_africa_world_bank_financial_sector_indicators_for_gambia_the, title = {Gambia, The - Financial Sector}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-financial-sector-indicators-for-gambia-the}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } ``` --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在金融发展研究领域,数据质量与标准化处理是确保分析可靠性的基石。该数据集源自世界银行集团发布的官方数据,通过人道主义数据交换平台获取原始资料。构建过程中,采用自动化流程从CKAN API下载数据,并转换为Parquet格式以优化存储与读取效率。列名经过统一规范处理,转为蛇形命名法,同时将各类缺失值标记统一为NaN值,增强了数据的一致性。最后,基于固定随机种子将数据集按80:20比例划分为训练集与测试集,并以Snappy压缩格式保存,为机器学习任务提供了即用型结构化数据。
特点
该数据集聚焦于冈比亚的金融部门指标,涵盖了从1960年至2025年的国家层面聚合数据。其核心特征体现在多维度的经济指标覆盖,包括私人部门国内信贷占GDP比重、净迁移人口以及官方汇率等关键变量。数据集共包含3,214条观测记录,涵盖8个字段,其中数值型与分类型变量分布均衡,且无缺失值,确保了数据的完整性。地理范围严格限定于冈比亚,指标代码与名称的对应关系清晰,辅以数据来源与处理时间戳元数据,为纵向与横向经济分析提供了高颗粒度的时序数据基础。
使用方法
在应用层面,该数据集适用于回归分析与经济指标预测等机器学习任务。用户可通过Hugging Face的datasets库直接加载数据,利用Python环境快速转换为Pandas DataFrame进行探索性分析。数据集已预分割为训练集与测试集,支持开箱即用的模型训练与评估流程。研究者可基于年份、指标类型等维度筛选数据,构建时间序列模型或跨指标关联分析。需要注意的是,数据源自世界银行原始统计,使用者应参考官方方法论说明以理解指标定义与潜在局限,确保分析结论的稳健性。
背景与挑战
背景概述
该数据集由世界银行集团于2026年发布,并由Electric Sheep Africa机构进行机器学习格式的整理与发布,聚焦于冈比亚的金融部门指标。在金融经济学领域,金融市场的深度与效率被视为驱动经济增长与减贫的核心机制,而该数据集通过系统收集1960年至2025年间的国家层面聚合数据,旨在量化金融体系的可及性、稳定性与流动性。其核心研究问题在于揭示金融部门指标如何影响经济发展轨迹,为政策制定者与研究人员提供了评估金融体系演变及其宏观经济影响的实证基础,对非洲区域的经济治理与可持续发展研究具有重要参考价值。
当前挑战
该数据集所解决的领域问题在于金融部门指标与经济表现之间的复杂关联建模,其挑战体现在金融数据的多维度性与时间动态性,例如如何准确捕捉信贷扩张、汇率波动与移民汇款等异质性指标对经济增长的非线性效应。在构建过程中,数据集面临原始数据收集的固有局限,包括世界银行报告中的定义不一致性、采样偏差以及潜在的数据误报问题,自动化清洗流程难以完全校正这些系统性误差,从而对模型的泛化能力与因果推断的可靠性构成潜在制约。
常用场景
经典使用场景
在金融经济学与发展研究领域,该数据集为分析冈比亚金融部门指标提供了结构化时序数据。研究者通常利用其包含的国内私人信贷占比、净移民、官方汇率等关键变量,构建时间序列模型以追踪该国金融体系的发展轨迹。这些指标能够反映金融深度、市场流动性及经济稳定性,为评估金融改革政策的效果提供了实证基础。通过机器学习方法,学者可以预测金融脆弱性,或识别影响经济增长的核心因素。
实际应用
在实际应用层面,该数据集被国际组织、政策制定者及咨询机构用于监测冈比亚的金融健康状态。基于指标趋势,相关部门可评估金融包容性项目的成效,或调整汇率政策以应对外部冲击。在风险管理领域,银行与投资者利用这些数据构建国家风险评分模型,以指导信贷决策与资产配置。此外,非政府组织可借助净移民与汇款数据,设计更精准的社会保障干预措施,增强经济韧性。
衍生相关工作
围绕该数据集衍生的经典工作主要包括两类:一是基于机器学习的金融预测研究,例如使用回归与时间序列模型预测信贷增长或汇率波动;二是比较发展研究,将冈比亚指标与其他非洲国家数据进行面板分析,以识别区域金融一体化的障碍。这些工作常发表于发展经济学与计算社会科学期刊,推动了数据驱动型政策评估框架的普及,并为后续构建跨国家金融风险预警系统提供了方法论基础。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务