five

africa-world-bank-external-debt-indicators-for-sao-tome-and-principe

收藏
Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-world-bank-external-debt-indicators-for-sao-tome-and-principe
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为“圣多美和普林西比 - 外债”,由世界银行集团发布,Electric Sheep Africa 为机器学习目的进行了整理。数据集包含圣多美和普林西比的国家级外债指标汇总数据,时间跨度为1960年至2024年。数据内容涵盖地理信息(国家名称、ISO3代码、年份)、结果/测量(数值范围从-105761604.4531到821454619.2873)以及标识符/元数据(指标名称、指标代码、数据来源和处理日期)。数据集总共有1,948行,分为训练集(1,558行)和测试集(389行),包含8个字段(2个数值型,6个类别型)。数据以Parquet格式提供,并经过标准化清理和缺失值统一处理。适用于表格回归任务,主要用于市场和价格监测领域。数据集的使用需遵循CC-BY-4.0许可协议。
创建时间:
2026-04-14
原始信息汇总

数据集概述:圣多美和普林西比 - 外债指标

基本信息

  • 数据集名称:Sao Tome and Principe - External Debt
  • 发布者:World Bank Group
  • 原始数据来源:https://data.humdata.org/dataset/world-bank-external-debt-indicators-for-sao-tome-and-principe
  • 数据提供方:Electric Sheep Africa
  • 许可证:cc-by-4.0
  • 语言:英语
  • 多语言性:单语
  • 规模类别:1K<n<10K
  • 任务类别:表格回归
  • 标签:africa, humanitarian, hdx, electric-sheep-africa, economics, indicators, stp
  • 最后更新日期(HDX):2026-03-27
  • 数据处理日期:2026-04-13

数据集内容

  • 数据描述:包含来自世界银行数据门户的圣多美和普林西比外债指标数据。债务统计数据详细描述了发展中国家的债务存量和流量。
  • 地理范围:STP(圣多美和普林西比)
  • 观察单位:国家层面汇总数据
  • 总行数:1,948
  • 列数:8
  • 数据分割
    • 训练集:1,558 行
    • 测试集:389 行

变量说明

  • 地理变量
    • country_name:圣多美和普林西比
    • country_iso3:STP
    • year:年份(范围 1960.0–2024.0)
  • 结果/测量变量
    • value:数值(范围 -105761604.4531–821454619.2873)
  • 标识符/元数据变量
    • indicator_name:指标名称(GNI (current US$), Net ODA received per capita (current US$), Net official development assistance received (current US$))
    • indicator_code:指标代码(NY.GNP.MKTP.CD, DT.ODA.ODAT.PC.ZS, DT.ODA.ODAT.CD)
    • esa_source:数据来源(HDX)
    • esa_processed:处理日期(2026-04-13)

数据模式

列名 类型 空值百分比 范围/示例值
country_name object 0.0% Sao Tome and Principe
country_iso3 object 0.0% STP
year int64 0.0% 1960.0 – 2024.0 (均值 2000.9199)
indicator_name object 0.0% GNI (current US$), Net ODA received per capita (current US$), Net official development assistance received (current US$)
indicator_code object 0.0% NY.GNP.MKTP.CD, DT.ODA.ODAT.PC.ZS, DT.ODA.ODAT.CD
value float64 0.0% -105761604.4531 – 821454619.2873 (均值 26349228.3015)
esa_source object 0.0% HDX
esa_processed object 0.0% 2026-04-13

数值摘要

列名 最小值 最大值 均值 中位数
year 1960.0 2024.0 2000.9199 2002.0
value -105761604.4531 821454619.2873 26349228.3015 1048802.95

数据处理

  • 原始数据通过CKAN API从HDX下载并转换为Parquet格式。
  • 列名被转换为小写并标准化为snake_case。
  • 常见的缺失值标记被统一为NaN
  • 数据集使用固定的随机种子(42)按80/20的比例分割为训练集和测试集,并保存为Snappy压缩的Parquet文件。

使用限制

  • 数据来源于世界银行集团,未经ESA独立验证。
  • 自动清洗无法纠正原始收集中误报的值、定义不一致或抽样偏差。
  • 有关发布者自身的方法说明和注意事项,请参考原始HDX数据集页面:https://data.humdata.org/dataset/world-bank-external-debt-indicators-for-sao-tome-and-principe

引用格式

bibtex @dataset{hdx_africa_world_bank_external_debt_indicators_for_sao_tome_and_principe, title = {Sao Tome and Principe - External Debt}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-external-debt-indicators-for-sao-tome-and-principe}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }

搜集汇总
数据集介绍
main_image_url
构建方式
在宏观经济监测领域,圣多美和普林西比外债指标数据集源于世界银行集团的官方数据门户,经由人道主义数据交换平台(HDX)公开发布。其构建过程遵循严谨的统计规范,原始数据由各国统计机构、中央银行及主要多边组织系统收集,涵盖了从1960年至2024年的国家层面债务存量与流动信息。Electric Sheep Africa团队通过CKAN API获取原始资料后,执行了系统的数据清洗与标准化流程,包括统一缺失值标记、规范列名格式,并采用固定随机种子将数据按80/20比例划分为训练集与测试集,最终封装为Snappy压缩的Parquet格式,确保了数据的机器学习可用性与结构一致性。
特点
该数据集聚焦于非洲岛国圣多美和普林西比的宏观经济债务指标,具备鲜明的领域专属性与时间序列特征。其核心特点体现在结构精简而信息密度高,共计1,948条观测记录,涵盖8个变量,其中包含表征国民总收入、人均官方发展援助净额等关键经济指标的具体数值与分类编码。数据地理范围严格限定于STP地区,时间跨度长达六十余年,为研究长期债务趋势提供了连续观测基础。此外,数据集已预先划分为训练与测试子集,且所有字段均无缺失值,这种完整性结合规范的元数据标注,为经济预测与回归建模提供了高度结构化的输入。
使用方法
在应用层面,该数据集主要服务于表格回归类机器学习任务,尤其适用于宏观经济指标预测与发展援助效益分析。使用者可通过Hugging Face的datasets库直接加载,利用Python环境便捷地将数据转换为Pandas DataFrame进行探索性分析或模型训练。典型工作流程包括调用load_dataset函数获取已分割的训练与测试集,继而借助数值型变量如'year'和'value'构建时间序列模型,或结合分类变量'indicator_name'进行多指标对比研究。鉴于数据已完成了标准化清洗与格式转换,研究者可专注于模型开发,同时建议参考世界银行原始方法论说明以深入理解指标定义与收集背景。
背景与挑战
背景概述
在全球化经济格局与可持续发展议程交织的背景下,外部债务数据成为评估发展中国家经济脆弱性与增长潜力的关键指标。世界银行集团作为国际发展领域的权威机构,长期致力于构建并维护全球债务统计体系,其发布的季度外债统计数据为分析高收入国家与新兴市场的金融流动提供了精细视角。该数据集由Electric Sheep Africa于2026年重新整理并发布,聚焦于非洲岛国圣多美和普林西比,涵盖了自1960年至2024年间的国民总收入、人均官方发展援助净额等核心经济指标,旨在为宏观经济建模、债务可持续性分析及发展政策评估提供结构化、机器学习友好的数据基础。
当前挑战
该数据集致力于解决发展中国家外部债务监测与宏观经济指标预测的领域挑战,其核心在于如何从时序性、高噪声的跨国经济数据中提取稳健模式,以支持债务可持续性与发展援助效益的精准评估。在构建过程中,挑战主要源于原始数据的异构性与质量局限:世界银行采集的各国统计数据可能存在报告标准不一致、定义差异或采样偏差,而自动化清洗流程难以修正潜在的误报值或方法论矛盾。此外,数据集仅涵盖单一国家的聚合层面,限制了跨区域比较或微观机制分析的深度,要求研究者必须谨慎处理数据局限性并参考原始方法论说明以确保结论的可靠性。
常用场景
经典使用场景
在宏观经济与债务研究领域,该数据集为圣多美和普林西比的外债指标提供了时序性观测框架。其经典使用场景聚焦于构建回归模型,以预测该国未来外债水平或官方发展援助的变动趋势。研究者常利用数据集中的年份、指标代码与数值变量,训练机器学习算法,分析外债与国民总收入等经济指标之间的动态关联,从而揭示债务可持续性的潜在规律。
衍生相关工作
围绕该数据集衍生的经典工作主要包括两类:一是基于机器学习的债务预测研究,例如利用时序回归或梯度提升模型预测圣多美和普林西比的外债轨迹;二是比较性经济分析,将该国数据与其他非洲国家的外债指标结合,探讨区域债务模式的异同。这些工作常发表于发展经济学与计算社会科学领域的期刊,推动了数据驱动方法在债务可持续性评估中的应用。
数据集最近研究
最新研究方向
在非洲经济与可持续发展研究领域,圣多美和普林西比外债指标数据集正成为探索小岛屿发展中国家债务可持续性与经济增长动态的关键资源。前沿研究聚焦于利用机器学习模型分析外债与国民总收入、官方发展援助之间的长期关联,旨在揭示债务累积对宏观经济稳定的影响机制。随着全球气候融资与债务减免倡议的兴起,该数据集被广泛应用于评估国际援助政策的效果,为制定精准的债务重组方案提供实证基础。其结构化特征亦支持时间序列预测与因果推断研究,助力学界深入理解非洲小国在全球金融体系中的脆弱性与韧性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作