five

africa-world-bank-public-sector-indicators-for-rwanda

收藏
Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-world-bank-public-sector-indicators-for-rwanda
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为“卢旺达 - 公共部门”,包含来自世界银行数据门户的国家级汇总数据,重点关注卢旺达的公共部门指标。数据集旨在通过提供经济管理、结构性政策、社会包容与公平政策以及公共部门管理和机构等方面的指标,帮助评估国家在提高人民生活水平方面的表现。数据集包含2,457行数据,分为1,965行的训练集和491行的测试集。每行数据包含8个字段,其中2个为数值型,6个为分类变量。地理范围限定为卢旺达(RWA)。数据集由Electric Sheep Africa整理为适合机器学习的Parquet格式,并提供了详细的变量描述、数据模式、数值摘要以及数据清洗和分割的详细信息。数据集的使用受CC-BY-4.0许可证约束。
创建时间:
2026-04-12
原始信息汇总

数据集概述:Rwanda - Public Sector

基本信息

  • 数据集名称:Rwanda - Public Sector
  • 发布者:World Bank Group
  • 原始数据来源:HDX (https://data.humdata.org/dataset/world-bank-public-sector-indicators-for-rwanda)
  • 数据提供与处理方:Electric Sheep Africa (https://huggingface.co/electricsheepafrica)
  • 许可证:cc-by-4.0
  • 语言:英语
  • 地理范围:RWA (卢旺达)
  • 领域:公共部门 / 公共卫生
  • 任务类别:表格分类

数据内容与结构

  • 数据描述:包含世界银行数据门户中关于卢旺达公共部门指标的数据,涵盖经济管理、结构性政策、社会包容与公平政策以及公共部门管理和机构等方面的评估。数据还包括国际货币基金组织政府财政统计中的收支指标以及来自各来源的税收政策指标。
  • 观察单位:国家级汇总数据
  • 数据总量:2,457 行
  • 数据划分
    • 训练集:1,965 行
    • 测试集:491 行
  • 数据列:共 8 列
    • 数值型:2 列 (year, value)
    • 类别型:6 列 (country_name, country_iso3, indicator_name, indicator_code, esa_source, esa_processed)
    • 日期时间型:0 列

变量说明

  • 地理变量
    • country_name:国家名称 (卢旺达)
    • country_iso3:国家 ISO3 代码 (RWA)
    • year:年份 (范围:1962.0 至 2024.0)
  • 结果/测量变量
    • value:指标数值 (范围:-691333832700.0 至 3207729110700.0)
  • 标识符/元数据变量
    • indicator_name:指标名称 (例如:Military expenditure (current LCU))
    • indicator_code:指标代码 (例如:MS.MIL.XPND.CN)
    • esa_source:数据来源 (HDX)
    • esa_processed:ESA 处理日期 (2026-04-11)

数据模式与统计摘要

  • 数据模式:所有列均无空值。
  • 数值摘要
    • year:最小值 1962.0,最大值 2024.0,均值 2009.1656,中位数 2013.0
    • value:最小值 -691333832700.0,最大值 3207729110700.0,均值 45780750078.3726,中位数 10.4478

数据管理

  • 数据处理:原始数据通过 CKAN API 从 HDX 下载并转换为 Parquet 格式。列名被转换为小写蛇形命名。常见的缺失值标记被统一为 NaN
  • 数据划分:使用固定的随机种子 (42) 按 80/20 的比例划分为训练集和测试集,并保存为 Snappy 压缩的 Parquet 文件。
  • 数据更新:HDX 数据最后更新于 2026-03-27。ESA 处理日期为 2026-04-11。

使用方式

可通过 Hugging Face datasets 库加载: python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-world-bank-public-sector-indicators-for-rwanda")

局限性

  • 数据来源于世界银行集团,未经 ESA 独立验证。
  • 自动清洗无法纠正原始数据中误报的值、定义不一致或抽样偏差。
  • 建议参考原始 HDX 数据集页面以了解发布者自身的方法说明和注意事项。

引用

bibtex @dataset{hdx_africa_world_bank_public_sector_indicators_for_rwanda, title = {Rwanda - Public Sector}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-public-sector-indicators-for-rwanda}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }

搜集汇总
数据集介绍
main_image_url
构建方式
在公共部门治理与经济发展研究领域,卢旺达公共部门指标数据集源于世界银行集团发布的权威数据,由Electric Sheep Africa团队通过系统化流程精心构建。原始数据从人道主义数据交换平台获取,经由CKAN API下载后,进行了标准化清洗与格式转换。具体而言,字段名称被统一为蛇形命名法,常见缺失值标记被规范为NaN,最终将数据转换为Snappy压缩的Parquet格式,并按照80:20的比例使用固定随机种子划分为训练集与测试集,确保了数据在机器学习应用中的即用性与可复现性。
特点
该数据集聚焦于卢旺达国家层面的公共部门表现,涵盖了从1962年至2024年长达六十余年的时序观测。其核心特征体现在高度结构化的表格形式,包含8个字段,其中既有国家名称、年份、指标代码等分类变量,也包含具体的数值型测量值。数据内容专门针对军事支出这一关键公共财政维度,提供了以本币、美元及占GDP比重为单位的多种测算指标,为深入分析国家财政结构、资源分配及其长期演变趋势提供了细致而连贯的实证基础。
使用方法
研究者与数据分析师可通过Hugging Face的`datasets`库便捷加载此数据集,直接用于机器学习模型的开发与评估。典型工作流程始于使用`load_dataset`函数加载数据,随后可轻松转换为Pandas DataFrame以进行探索性分析或特征工程。数据集已预分为训练集与测试集,支持开箱即用的监督学习任务,尤其适用于时间序列预测、指标分类或异常检测等模型构建。用户应结合原始世界银行的方法论说明,审慎理解指标定义与数据局限,以确保分析结论的稳健性。
背景与挑战
背景概述
在公共管理与发展经济学领域,量化评估国家公共部门效能是理解政府治理与经济发展关联的核心议题。世界银行集团作为全球发展数据的重要权威机构,长期致力于构建跨国公共部门指标体系,以监测各国在经济增长、社会包容及制度管理等方面的表现。该数据集由世界银行于2026年发布,并由Electric Sheep Africa机构进行机器学习适配化处理,聚焦于卢旺达的公共部门指标,涵盖军事支出等关键财政数据,时间跨度自1962年至2024年。其核心研究问题在于通过结构化时序数据,揭示公共资源配置与国家发展轨迹之间的内在规律,为政策分析、经济预测及学术研究提供实证基础,对非洲区域研究及发展干预评估具有重要参考价值。
当前挑战
该数据集旨在解决公共部门绩效量化与跨国比较的领域挑战,具体涉及如何从多维指标中提取有效特征以支持经济政策分类或预测建模。数据构建过程中面临若干技术性难题:原始数据源自国际组织聚合统计,可能存在定义不一致或报告偏差,例如军事支出指标在不同货币单位与GDP占比间的换算一致性;同时,时序跨度长达六十余年,期间统计方法与口径变更可能导致数据断裂或可比性下降。此外,数据集规模相对有限,仅包含三个核心指标,且以国家年度为聚合单元,在捕捉微观政策效应或非线性动态时存在粒度不足的局限,这要求后续建模需结合领域知识进行特征增强或外部数据融合。
常用场景
解决学术问题
该数据集有效解决了发展经济学中关于公共财政透明度和政策评估的若干核心问题。通过提供标准化的军事支出指标,它使学者能够系统检验“军事负担假说”,即高额国防开支是否挤占民生投入并抑制经济增长。同时,这些数据支持对卢旺达后冲突时期国家构建过程的研究,为评估安全部门改革与财政可持续性的平衡提供了量化依据,填补了非洲国家细粒度公共财政面板数据的空白。
衍生相关工作
围绕该数据集衍生的经典研究多聚焦于非洲国家的安全经济学领域。例如,学者利用其构建了卢旺达军事支出与经济增长的向量自回归模型,揭示了国防预算冲击对私营部门投资的溢出效应。另一项重要工作则整合多国类似指标,开展了东非共同体国家的比较研究,检验区域一体化进程中军事开支收敛假说。这些成果显著推进了关于冲突后国家财政转型的理论与实证认知。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作