five

asia-external-debt-world-bank-external-debt-indicators-for

收藏
Hugging Face2026-05-05 更新2026-05-06 收录
下载链接:
https://huggingface.co/datasets/electricsheepasia/asia-external-debt-world-bank-external-debt-indicators-for
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Turkiye - External Debt,由世界银行集团发布,来源于HDX平台。数据集包含土耳其的外部债务指标,提供了发展中国家债务存量和流量的详细情况。数据以国家层面的汇总形式呈现,每行代表一个国家级别的聚合数据。数据集包含3,008行和8列(2个数值型,6个分类型),分为训练集(2,406行)和测试集(601行)。地理范围限定为土耳其(TUR)。数据集中的变量包括地理信息(国家名称、ISO3代码、年份)、结果/测量(数值范围从-74403000000.0到1343248768559.98)以及标识符/元数据(指标名称、指标代码、数据来源和处理日期)。数据集经过整理,转换为Parquet格式,并进行了标准化处理,适用于表格回归任务。数据集的使用限制包括数据未经独立验证,可能存在报告错误或定义不一致的情况。
创建时间:
2026-05-04
原始信息汇总

Turkiye - 外部债务数据集概述

基本信息

  • 数据集名称: Turkiye - External Debt
  • 发布者: World Bank Group
  • 数据来源: HDX平台
  • 许可证: CC-BY-4.0
  • 语言: 英语
  • 更新时间: 2026-04-28
  • 地理范围: 土耳其(TUR)
  • 数据集规模: 3,008行,8列
  • 领域: 市场与价格监测

内容摘要

该数据集包含世界银行关于土耳其外部债务的详细统计数据,涵盖债务存量、流量以及季度外部债务、公共部门债务等指标。数据由世界银行收集自各国统计机构、中央银行及多边机构,每个数据行代表国家层面的汇总值。经Electric Sheep Africa整理为机器学习就绪的Parquet格式。

数据集划分

划分 样本数
训练集 2,406
测试集 601
总计 3,008

变量说明

列名 类型 描述
country_name object 国家名称(固定为Turkiye)
country_iso3 object 国家ISO代码(固定为TUR)
year int64 年份,范围1960.0–2024.0
indicator_name object 指标名称(如总储备、技术合作赠款等)
indicator_code object 指标代码(如FI.RES.TOTL.CD等)
value float64 指标数值(范围-74403000000.0至1343248768559.98)
esa_source object 数据来源(固定为HDX)
esa_processed object 处理日期(固定为2026-05-05)

数值统计

最小值 最大值 均值 中位数
year 1960.0 2024.0 1996.84 1997.0
value -74403000000.0 1343248768559.98 21315189902.24 142177450.0

数据预处理

  • 原始数据通过HDX的CKAN API下载并转换为Parquet格式
  • 列名统一为小写蛇形命名
  • 缺失值标记(N/A、null等)统一转换为NaN
  • 按80/20比例随机切分为训练集和测试集(固定随机种子42)
  • 使用Snappy压缩存储

局限性

  • 数据源自世界银行,未经Electric Sheep Africa独立验证
  • 自动化清洗无法修正原始数据中的误报、定义不一致或采样偏差
  • 建议查阅原始HDX数据集页面获取发布者的方法论说明
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界银行集团的官方债务统计数据库,经由人道主义数据交换(HDX)平台获取,并由Electric Sheep Africa团队进行精制转换。原始数据通过CKAN API从HDX下载,随后被转化为高效的Parquet格式。在数据清洗阶段,列名被统一转换为小写蛇形命名法,各类常见的缺失值标记均被规范化处理为NaN。最终,数据集以固定随机种子(42)按80/20的比例划分为训练集与测试集,并保存为Snappy压缩的Parquet文件,为机器学习任务提供了标准化、可直接使用的数据形态。
特点
该数据集聚焦于土耳其(Turkiye)的外部债务与经济指标,呈现国家层面的聚合观测值,涵盖1960年至2024年的长跨度时序信息。数据包含8个字段,包括2个数值型变量(年份与外债价值)与6个类别型变量,共计3008行记录。核心指标如总储备金、技术合作赠款及官方发展援助净额等,均源自世界银行的权威编码体系,确保了数据来源的可靠性与国际可比性。经过精炼的Parquet格式与明确的训练/测试分割,显著提升了数据在机器学习工作流中的实用性与效率。
使用方法
用户可通过HuggingFace的`datasets`库便捷加载该数据集,仅需一行代码`load_dataset("electricsheepafrica/asia-external-debt-world-bank-external-debt-indicators-for")`即可获取完整的训练与测试分割。加载后的数据可直接转换为Pandas DataFrame格式,便于进行探索性数据分析、特征工程或作为回归模型的输入。由于数据已预先完成标准化清洗与分割,研究者能够迅速将其应用于经济预测、债务趋势分析等机器学习任务,大幅缩短了数据预处理的时间成本。
背景与挑战
背景概述
该数据集由世界银行集团发布,经Electric Sheep Africa于2026年整理为机器学习就绪格式,聚焦土耳其的外部债务与经济指标。研究背景植根于全球债务统计领域,旨在系统呈现发展中国家及新兴市场(如土耳其)的债务存量、流量及公共部门财务结构,以填补高收入国家与新兴经济体在金融流动监测中的数据鸿沟。核心研究问题围绕国家层面的债务指标聚合(如总储备、技术合作赠款、净官方发展援助),通过量化时间序列(1960–2024年)揭示债务演进规律。作为HDX人道主义数据交换生态的一部分,该数据集为宏观经济学、人道主义资金流动及发展援助效果评估提供了标准化基准,对理解新兴市场债务脆弱性及国际金融治理具有重要影响。
当前挑战
该数据集面临的领域挑战在于:债务统计涉及多源异构数据(如国际收支、公共部门债务工具),需统一来自不同国家统计机构与多边实体的定义差异,例如技术合作赠款与官方发展援助的核算边界模糊,导致跨国家或跨时期可比性受限。构建过程中,原始数据中常见缺失值标记(如N/A、null)被统一为NaN,但自动化清洗无法纠正误报值或抽样偏差;同时,数据集仅涵盖土耳其一国,缺乏跨区域对照,限制了模型泛化能力。此外,时间范围跨度大(1960–2024年),早期数据可能存在口径不一致问题,且部分指标(如总储备)的负值暗示数据标记或转换错误,为回归任务引入了噪声与不确定性。
常用场景
经典使用场景
该数据集以世界银行官方发布的外债统计指标为核心,围绕土耳其自1960年至2024年间的时间序列数据,为宏观经济与金融领域的实证研究提供了标准化的结构化面板数据。经典使用场景集中于利用‘value’变量对外债规模、外汇储备、官方发展援助等关键经济指标进行回归建模与趋势预测,研究者常通过年份与指标代码的组合,构建多元时间序列模型以分析土耳其外部债务的动态演变规律,尤其适用于探讨发展中国家债务可持续性与国际资本流动之间的关联机制。
解决学术问题
在学术层面,该数据集有效解决了发展中国家长期外债数据分散且口径不统一的研究困境,为验证外债规模与经济增长、宏观经济稳定性之间的理论假说提供了可靠的数据支撑。通过覆盖1960至2024年的长时段指标,研究者得以剖析外部冲击下债务积累的周期特征,以及官方援助与储备资产在缓冲经济波动中的作用,进而推动关于债务阈值效应与主权信用风险评估的计量方法创新,其影响在于提升了跨国面板研究在单一国家深度案例上的数据颗粒度与可复现性。
衍生相关工作
该数据集衍生出一系列聚焦于外债驱动因素与宏观因果推断的经典工作,包括基于长短期记忆网络的债务规模预测模型、利用外债与储备比率构建的主权违约概率Logit回归框架,以及融合面板向量自回归的援助有效性评估研究。这些工作不仅继承了世界银行数据的高公信力,还通过机器学习管道将原始统计指标转化为可复用的特征工程范式,推动了‘Electric Sheep Africa’等开源社区在非洲及中东地区的债务数据分析基准建设,进一步催化了宏观经济数据与深度学习交叉领域的标准化评价体系形成。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作