five

africa-world-bank-external-debt-indicators-for-somalia

收藏
Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-world-bank-external-debt-indicators-for-somalia
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为'索马里-外债',由世界银行集团发布,来源于HDX平台,采用cc-by-4.0许可协议。数据集包含索马里国家层面的外债统计数据,旨在提供发展中国家外债存量和流动的详细情况。数据集包含1,799行数据,分为1,439行的训练集和359行的测试集。每行数据代表国家层面的汇总信息,包含8个字段:2个数值型字段和6个分类字段。主要字段包括国家名称、ISO3代码、年份、指标名称、指标代码、数值等。数据集适用于表格回归任务,主要用于市场和价格监测领域。数据集由Electric Sheep Africa整理为适合机器学习的Parquet格式,并进行了标准化处理和缺失值统一。需要注意的是,数据来源于世界银行集团,未经ESA独立验证,可能存在报告错误或定义不一致的情况。

This dataset is named 'Somalia - External Debt', published by the World Bank Group, sourced from the HDX platform, and licensed under CC-BY-4.0. It includes national-level external debt statistics for Somalia, with the goal of providing detailed information on the stock and flow of external debt across developing countries. The dataset consists of 1,799 rows in total, split into a training set with 1,439 rows and a test set with 359 rows. Each row represents national-level aggregated information, with 8 fields in total: 2 numeric fields and 6 categorical fields. The core fields include country name, ISO3 code, year, indicator name, indicator code, and value, among others. This dataset is suitable for tabular regression tasks, and is primarily used in the market and price monitoring domain. It was formatted into machine-learning-ready Parquet files by Electric Sheep Africa, with standardized processing and unified handling of missing values performed. It should be noted that the data is sourced from the World Bank Group, and has not been independently verified by ESA. Reported errors or inconsistent definitions may exist in the dataset.
创建时间:
2026-04-08
原始信息汇总

数据集概述:Somalia - External Debt

基本描述

  • 数据集名称:Somalia - External Debt
  • 数据集标识electricsheepafrica/africa-world-bank-external-debt-indicators-for-somalia
  • 发布方:World Bank Group
  • 数据来源:HDX (https://data.humdata.org/dataset/world-bank-external-debt-indicators-for-somalia)
  • 数据提供方:Electric Sheep Africa (https://huggingface.co/electricsheepafrica)
  • 许可协议:cc-by-4.0
  • 数据更新日期:2025-08-28 (HDX)
  • 数据处理日期:2026-04-08 (ESA)

数据集内容与特征

  • 领域:市场与价格监测
  • 观测单位:国家级汇总数据
  • 地理范围:索马里 (SOM)
  • 语言:英语
  • 数据规模:1K<n<10K
  • 总行数:1,799
  • 总列数:8
  • 数据划分
    • 训练集:1,439 行
    • 测试集:359 行
  • 任务类别:表格回归

变量说明

数据集包含8个变量,具体如下:

地理变量

  • country_name:国家名称 (索马里)
  • country_iso3:国家ISO3代码 (SOM)
  • year:年份 (范围:1960.0–2024.0)

结果/测量变量

  • value:指标数值 (范围:-350052126.8–12061515109.9996)

标识符/元数据变量

  • indicator_name:指标名称 (例如:GNI (current US$), Technical cooperation grants (BoP, current US$), Net official development assistance received (current US$))
  • indicator_code:指标代码 (例如:NY.GNP.MKTP.CD, BX.GRT.TECH.CD.WD, DT.ODA.ODAT.CD)
  • esa_source:数据来源 (HDX)
  • esa_processed:数据处理日期 (2026-04-08)

数据模式与统计摘要

数据模式

列名 类型 空值比例 范围/示例值
country_name object 0.0% Somalia, #country+name
country_iso3 object 0.0% SOM, #country+code
year float64 0.1% 1960.0 – 2024.0 (mean 1994.228)
indicator_name object 0.0% GNI (current US$), Technical cooperation grants (BoP, current US$), Net official development assistance received (current US$)
indicator_code object 0.0% NY.GNP.MKTP.CD, BX.GRT.TECH.CD.WD, DT.ODA.ODAT.CD
value float64 0.1% -350052126.8 – 12061515109.9996 (mean 340426754.4722)
esa_source object 0.0% HDX
esa_processed object 0.0% 2026-04-08

数值摘要

列名 最小值 最大值 平均值 中位数
year 1960.0 2024.0 1994.228 1992.0
value -350052126.8 12061515109.9996 340426754.4722 1525513.6

数据处理流程

  • 原始数据通过CKAN API从HDX下载并转换为Parquet格式。
  • 列名被转换为小写和下划线格式。
  • 常见的缺失值标记被统一为NaN
  • 2个列基于解析成功率(>85%阈值)从字符串转换为数值或日期时间类型。
  • 使用固定随机种子(42)将数据集按80/20的比例划分为训练集和测试集,并保存为Snappy压缩的Parquet文件。

使用方式

python from datasets import load_dataset

ds = load_dataset("electricsheepafrica/africa-world-bank-external-debt-indicators-for-somalia") train = ds["train"].to_pandas() test = ds["test"].to_pandas()

局限性说明

  • 数据源自世界银行集团,未经ESA独立验证。
  • 自动清洗无法纠正原始收集中误报的数值、定义不一致或抽样偏差。
  • 有关发布方的方法说明和注意事项,请参考原始HDX数据集页面 (https://data.humdata.org/dataset/world-bank-external-debt-indicators-for-somalia)。

引用格式

bibtex @dataset{hdx_africa_world_bank_external_debt_indicators_for_somalia, title = {Somalia - External Debt}, author = {World Bank Group}, year = {2025}, url = {https://data.humdata.org/dataset/world-bank-external-debt-indicators-for-somalia}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }

搜集汇总
数据集介绍
main_image_url
构建方式
在宏观经济监测领域,索马里外部债务指标数据集通过系统化流程构建而成。原始数据源自世界银行集团的官方数据门户,经由人道主义数据交换平台获取,并由Electric Sheep Africa团队进行专业化整理。数据采集覆盖了从1960年至2024年的长期时间序列,整合了国家层面的债务存量与流动指标。构建过程中,团队通过CKAN API下载原始数据,统一了缺失值标记,并将符合条件的字段转换为数值类型,最终以80/20的比例随机划分为训练集与测试集,并以Snappy压缩的Parquet格式存储,确保了数据的机器学习可用性。
使用方法
在应用层面,该数据集适用于监督学习框架下的表格回归任务。研究人员可通过Hugging Face的datasets库直接加载数据,并便捷地转换为Pandas DataFrame进行后续分析。数据集已预分为训练集与测试集,用户可在此基础上构建时间序列预测模型或宏观经济指标关联分析。典型应用场景包括债务趋势预测、援助效益评估以及经济脆弱性建模。使用时应参考原始发布方的方法说明,并注意数据源自国际机构汇总,需结合领域知识进行合理解释。
背景与挑战
背景概述
在全球经济治理与发展研究领域,外部债务数据是评估国家财政健康、国际资本流动与发展援助有效性的关键指标。世界银行集团作为权威的国际金融机构,长期系统性地收集并发布各国债务统计数据,旨在为政策制定者、研究人员及国际组织提供决策支持。该数据集由Electric Sheep Africa于2025年8月28日整理发布,聚焦索马里自1960年至2024年的外部债务与相关经济指标,涵盖了国民总收入、技术合作赠款及官方发展援助净额等核心变量。其创建基于世界银行数据门户与HDX平台,通过标准化处理转化为机器学习可用格式,为深入探究脆弱国家的债务可持续性与经济发展轨迹提供了宝贵的纵向数据基础。
当前挑战
该数据集致力于解决宏观经济指标预测与债务可持续性分析中的回归建模挑战,其核心在于从有限的国家级时间序列数据中捕捉复杂的经济动态与外部冲击效应。构建过程中面临多重挑战:原始数据依赖于各国统计机构与中央银行的报告,可能存在报告延迟、定义不一致或测量误差;自动化清洗流程虽统一了缺失值标记与数据类型,但难以修正源数据中的误报值或抽样偏差;此外,索马里作为冲突后国家,其数据收集体系可能较为薄弱,导致部分年份数据缺失或可靠性存疑,这为构建稳健的预测模型带来了数据质量与完整性的固有局限。
常用场景
经典使用场景
在宏观经济与债务研究领域,该数据集为索马里外部债务指标的时序分析提供了核心数据支撑。研究者通常利用其涵盖1960年至2024年的年度观测值,通过回归模型探究国民总收入、官方发展援助净额与技术合作赠款等关键指标与债务动态的关联。数据集的结构化特征使得时间序列预测与因果推断成为可能,为理解债务累积的长期趋势奠定了实证基础。
解决学术问题
该数据集有效应对了发展经济学中关于债务可持续性与经济增长关系的经典议题。通过提供标准化的国家层面债务与援助指标,它使得学者能够量化外部冲击对索马里经济的影响,检验债务减免政策的有效性,并评估国际援助在脆弱国家中的作用。这些工作深化了对债务陷阱机制与外部融资依赖性的理解,为政策设计提供了微观证据。
实际应用
在实践层面,该数据集被国际组织与政策分析机构用于监测索马里的债务风险与财政健康状况。世界银行、国际货币基金组织等机构可依据这些指标评估债务重组方案的可行性,而人道主义组织则能据此优化援助分配策略。此外,数据还可服务于国别风险评估模型,为投资者与金融机构在新兴市场的决策提供参考依据。
数据集最近研究
最新研究方向
在非洲经济与发展研究领域,索马里外债指标数据集正推动前沿探索,聚焦于债务可持续性与人道主义危机的交叉分析。随着全球金融波动加剧,该数据集被用于构建时间序列模型,预测债务脆弱性对粮食安全与公共卫生的影响。研究热点整合了机器学习方法,如梯度提升与神经网络,以识别债务指标与外部援助流动的复杂关联,为国际组织制定精准干预策略提供实证基础。这些工作不仅深化了对冲突地区经济韧性的理解,也促进了数据驱动的人道主义响应机制创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作