five

electricsheepafrica/africa-world-bank-external-debt-indicators-for-south-sudan

收藏
Hugging Face2026-04-10 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-external-debt-indicators-for-south-sudan
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - no-annotation language_creators: - found language: - en license: cc-by-4.0 multilinguality: - monolingual size_categories: - n<1K source_datasets: - original task_categories: - tabular-regression task_ids: [] tags: - africa - humanitarian - hdx - electric-sheep-africa - economics - indicators - ssd pretty_name: "South Sudan - External Debt" dataset_info: splits: - name: train num_examples: 111 - name: test num_examples: 27 --- # South Sudan - External Debt **Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-external-debt-indicators-for-south-sudan) · **License:** `cc-by` · **Updated:** 2026-03-27 --- ## Abstract Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-south-sudan) on HDX. Debt statistics provide a detailed picture of debt stocks and flows of developing countries. Data presented as part of the Quarterly External Debt Statistics takes a closer look at the external debt of high-income countries and emerging markets to enable a more complete understanding of global financial flows. The Quarterly Public Sector Debt database provides further data on public sector valuation methods, debt instruments, and clearly defined tiers of debt for central, state and local government, as well as extra-budgetary agencies and funds. Data are gathered from national statistical organizations and central banks as well as by various major multilateral institutions and World Bank staff. Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **SSD**. *Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).* --- ## Dataset Characteristics | | | |---|---| | **Domain** | Market and price monitoring | | **Unit of observation** | Country-level aggregates | | **Rows (total)** | 139 | | **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) | | **Train split** | 111 rows | | **Test split** | 27 rows | | **Geographic scope** | SSD | | **Publisher** | World Bank Group | | **HDX last updated** | 2026-03-27 | --- ## Variables **Geographic** — `country_name` (South Sudan), `country_iso3` (SSD), `year` (range 2011.0–2024.0). **Outcome / Measurement** — `value` (range -1717500000.0–17413371593.2203). **Identifier / Metadata** — `indicator_name` (Grants, excluding technical cooperation (BoP, current US$), Technical cooperation grants (BoP, current US$), Foreign direct investment, net inflows (BoP, current US$)), `indicator_code` (BX.GRT.EXTA.CD.WD, BX.GRT.TECH.CD.WD, BX.KLT.DINV.CD.WD), `esa_source` (HDX), `esa_processed` (2026-04-10). --- ## Quick Start ```python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-world-bank-external-debt-indicators-for-south-sudan") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() ``` --- ## Schema | Column | Type | Null % | Range / Sample Values | |---|---|---|---| | `country_name` | object | 0.0% | South Sudan | | `country_iso3` | object | 0.0% | SSD | | `year` | int64 | 0.0% | 2011.0 – 2024.0 (mean 2017.4101) | | `indicator_name` | object | 0.0% | Grants, excluding technical cooperation (BoP, current US$), Technical cooperation grants (BoP, current US$), Foreign direct investment, net inflows (BoP, current US$) | | `indicator_code` | object | 0.0% | BX.GRT.EXTA.CD.WD, BX.GRT.TECH.CD.WD, BX.KLT.DINV.CD.WD | | `value` | float64 | 0.0% | -1717500000.0 – 17413371593.2203 (mean 1357663012.3125) | | `esa_source` | object | 0.0% | HDX | | `esa_processed` | object | 0.0% | 2026-04-10 | --- ## Numeric Summary | Column | Min | Max | Mean | Median | |---|---|---|---|---| | `year` | 2011.0 | 2024.0 | 2017.4101 | 2017.0 | | `value` | -1717500000.0 | 17413371593.2203 | 1357663012.3125 | 131761234.0 | --- ## Curation Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet. --- ## Limitations - Data originates from World Bank Group and has not been independently validated by ESA. - Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection. - Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-external-debt-indicators-for-south-sudan) for the publisher's own methodology notes and caveats. --- ## Citation ```bibtex @dataset{hdx_africa_world_bank_external_debt_indicators_for_south_sudan, title = {South Sudan - External Debt}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-external-debt-indicators-for-south-sudan}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } ``` --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在宏观经济监测领域,外部债务数据对于评估国家财政健康至关重要。本数据集由世界银行集团发布,原始数据通过其官方数据门户及人道主义数据交换平台收集,涵盖南苏丹自2011年至2024年的国家层面债务指标。数据采集过程整合了各国统计机构、中央银行及多边国际组织的权威报告,确保了来源的可靠性。随后,Electric Sheep Africa团队通过CKAN API获取原始数据,并执行了标准化清洗流程,包括统一缺失值标记、规范列名格式,最终将数据转换为适合机器学习处理的Parquet格式,并按照固定随机种子划分为训练集与测试集。
使用方法
该数据集适用于回归分析、经济指标预测等机器学习任务。使用者可通过Hugging Face的datasets库直接加载,利用Python环境快速获取结构化数据。加载后,数据可便捷地转换为Pandas DataFrame进行探索性分析或特征工程。研究者可基于年份、指标类型等分类变量,对资金流动数值进行趋势建模或异常检测。鉴于数据已预先分割,模型训练与评估可直接在训练集和测试集上进行。需要注意的是,应用时应参考世界银行原始方法论说明,以理解指标定义与收集局限,确保分析结论的稳健性。
背景与挑战
背景概述
在全球化经济背景下,发展中国家的外部债务动态是国际金融与宏观经济研究的关键议题。世界银行集团作为权威的国际金融机构,长期致力于收集与发布全球债务统计数据,以揭示债务存量与流动的复杂图景。该数据集由世界银行集团创建,并由Electric Sheep Africa于2026年重新整理为机器学习可用格式,聚焦于南苏丹这一新兴经济体的外部债务指标。其核心研究问题在于量化南苏丹在2011年至2024年间的外部债务、赠款及外国直接投资等关键经济指标,旨在为政策制定者、研究人员及人道主义组织提供数据支持,以评估该国的债务可持续性与经济发展轨迹。该数据集作为非洲经济监测基础设施的一部分,为区域经济分析与预测模型提供了重要的实证基础。
当前挑战
该数据集致力于解决宏观经济指标回归分析中的挑战,特别是在新兴经济体债务可持续性评估方面。由于南苏丹经济数据统计体系尚不完善,原始数据可能存在报告延迟、定义不一致及采样偏差等问题,这给构建精准的预测模型带来了困难。在数据集构建过程中,挑战主要源于数据源的异构性与质量控制的复杂性。世界银行的数据收集依赖于各国统计机构与中央银行的报告,可能存在数值误报或方法论差异。尽管Electric Sheep Africa进行了自动化清洗与格式标准化,但仍无法完全纠正原始数据中的系统性误差。此外,数据集规模较小,仅包含139条国家层面聚合记录,限制了复杂机器学习模型的训练与应用,对模型泛化能力构成了显著约束。
常用场景
经典使用场景
在宏观经济与债务研究领域,该数据集为南苏丹的外部债务指标提供了结构化时序数据,涵盖2011年至2024年的年度观测。经典使用场景聚焦于时间序列回归分析,研究者可基于年份与数值变量构建预测模型,用以估计未来债务趋势或外部资金流动。通过整合技术合作赠款、外国直接投资净流入等多元指标,该数据集支持对债务构成与外部经济依赖性的深入探索,为发展经济学中的债务可持续性评估奠定实证基础。
解决学术问题
该数据集有效应对了发展经济学中关于债务动态与经济增长关联的经典学术问题。通过提供标准化的国别债务指标,它助力研究者剖析外部债务对新兴经济体财政稳定性的影响,并检验债务减免或赠款援助在脆弱国家中的实际效应。其意义在于填补了南苏丹这一战后重建国家的高质量经济数据空白,为跨国比较研究与政策评估提供了可靠基准,推动了债务治理领域的实证进展。
实际应用
在实际应用层面,该数据集被广泛用于国际组织与政策机构的监测与决策支持。例如,世界银行、人道主义数据交换平台可借助这些指标评估南苏丹的债务风险,并设计针对性的财政援助方案。在机器学习领域,经过清洗与格式化的数据可直接输入回归模型,用于预测债务违约概率或优化资源分配策略,从而提升发展干预的精准性与时效性。
数据集最近研究
最新研究方向
在非洲经济监测领域,南苏丹外债指标数据集正推动机器学习模型在脆弱国家债务可持续性分析中的应用。前沿研究聚焦于利用时间序列回归方法,预测外债波动对宏观经济稳定的影响,结合技术合作赠款和外国直接投资等指标,评估外部冲击下的经济韧性。这一方向呼应全球对低收入国家债务危机预警的热点关切,其意义在于为国际组织提供数据驱动的决策支持,助力人道主义援助与长期发展政策的精准制定。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务