five

electricsheepafrica/africa-world-bank-public-sector-indicators-for-zimbabwe

收藏
Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-public-sector-indicators-for-zimbabwe
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - no-annotation language_creators: - found language: - en license: cc-by-4.0 multilinguality: - monolingual size_categories: - 1K<n<10K source_datasets: - original task_categories: - tabular-classification task_ids: [] tags: - africa - humanitarian - hdx - electric-sheep-africa - economics - indicators - zwe pretty_name: "Zimbabwe - Public Sector" dataset_info: splits: - name: train num_examples: 1677 - name: test num_examples: 419 --- # Zimbabwe - Public Sector **Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-public-sector-indicators-for-zimbabwe) · **License:** `cc-by` · **Updated:** 2026-03-27 --- ## Abstract Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-zimbabwe) on HDX. Effective governments improve people's standard of living by ensuring access to essential services – health, education, water and sanitation, electricity, transport – and the opportunity to live and work in peace and security. Data here includes World Bank staff assessments of country performance in economic management, structural policies, policies for social inclusion and equity, and public sector management and institutions for the poorest countries. Also included are indicators on revenues and expenses from the International Monetary Fund's Government Finance Statistics, and on tax policies from various sources. Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **ZWE**. *Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).* --- ## Dataset Characteristics | | | |---|---| | **Domain** | Public health | | **Unit of observation** | Country-level aggregates | | **Rows (total)** | 2,097 | | **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) | | **Train split** | 1,677 rows | | **Test split** | 419 rows | | **Geographic scope** | ZWE | | **Publisher** | World Bank Group | | **HDX last updated** | 2026-03-27 | --- ## Variables **Geographic** — `country_name` (Zimbabwe), `country_iso3` (ZWE), `year` (range 1960.0–2024.0). **Outcome / Measurement** — `value` (range -1037965.6118–3637600000000.0). **Identifier / Metadata** — `indicator_name` (Military expenditure (% of GDP), Military expenditure (current LCU), Military expenditure (current USD)), `indicator_code` (MS.MIL.XPND.GD.ZS, MS.MIL.XPND.CN, MS.MIL.XPND.CD), `esa_source` (HDX), `esa_processed` (2026-04-11). --- ## Quick Start ```python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-world-bank-public-sector-indicators-for-zimbabwe") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() ``` --- ## Schema | Column | Type | Null % | Range / Sample Values | |---|---|---|---| | `country_name` | object | 0.0% | Zimbabwe | | `country_iso3` | object | 0.0% | ZWE | | `year` | int64 | 0.0% | 1960.0 – 2024.0 (mean 2010.2146) | | `indicator_name` | object | 0.0% | Military expenditure (% of GDP), Military expenditure (current LCU), Military expenditure (current USD) | | `indicator_code` | object | 0.0% | MS.MIL.XPND.GD.ZS, MS.MIL.XPND.CN, MS.MIL.XPND.CD | | `value` | float64 | 0.0% | -1037965.6118 – 3637600000000.0 (mean 1985244207.3109) | | `esa_source` | object | 0.0% | HDX | | `esa_processed` | object | 0.0% | 2026-04-11 | --- ## Numeric Summary | Column | Min | Max | Mean | Median | |---|---|---|---|---| | `year` | 1960.0 | 2024.0 | 2010.2146 | 2012.0 | | `value` | -1037965.6118 | 3637600000000.0 | 1985244207.3109 | 5.1643 | --- ## Curation Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet. --- ## Limitations - Data originates from World Bank Group and has not been independently validated by ESA. - Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection. - Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-public-sector-indicators-for-zimbabwe) for the publisher's own methodology notes and caveats. --- ## Citation ```bibtex @dataset{hdx_africa_world_bank_public_sector_indicators_for_zimbabwe, title = {Zimbabwe - Public Sector}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-public-sector-indicators-for-zimbabwe}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } ``` --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在公共部门治理与经济发展研究领域,该数据集通过系统整合世界银行数据门户的权威信息构建而成。原始数据经由人道主义数据交换平台获取,涵盖津巴布韦国家层面的宏观指标,具体包括经济管理、结构性政策、社会包容与公平政策以及公共部门管理与制度等多维评估。数据预处理过程中,采用自动化流程统一了缺失值标记,并将列名规范化为蛇形命名法,最终以Snappy压缩的Parquet格式存储,确保了数据的结构一致性与高效访问。
特点
该数据集聚焦于津巴布韦的公共部门表现,其核心特征体现在以国家为观测单元,时间跨度自1960年至2024年,完整记录了军事支出占GDP比重、本币与美元计值的军事支出等关键指标。数据集包含2097条记录,划分为训练集与测试集,其中数值型与分类型变量分布清晰,且所有字段均无缺失值,为模型训练提供了高质量的结构化输入。地理范围严格限定于津巴布韦,指标代码与名称的对应关系明确,增强了数据的可解释性与跨研究可比性。
使用方法
为便于机器学习任务的应用,该数据集已通过Hugging Face平台提供标准化访问接口。研究者可使用datasets库直接加载数据,并轻松转换为Pandas DataFrame进行探索性分析。数据集默认按80:20比例划分为训练与测试子集,支持分类或回归等表格预测任务。用户可依据年份、指标代码等维度筛选样本,或基于数值型变量进行趋势分析与模型拟合,同时应参考原始发布方的方法说明以理解指标背后的统计假设与局限。
背景与挑战
背景概述
在公共部门管理与国际发展研究领域,量化评估国家治理效能与财政健康状况是推动政策优化与资源分配的核心议题。世界银行集团作为全球发展数据的重要权威机构,长期致力于构建跨国公共部门指标体系,以监测各国在经济管理、社会包容及制度建设等方面的表现。该数据集由世界银行于2026年发布,并由Electric Sheep Africa团队进行机器学习适配化处理,聚焦津巴布韦的军事支出等关键公共财政指标,涵盖1960年至2024年的国家层面聚合数据。其核心研究问题在于通过标准化指标揭示公共资源分配的长期趋势与结构性特征,为发展经济学、公共政策分析及跨国比较研究提供实证基础,对非洲区域治理评估与可持续发展目标监测具有重要参考价值。
当前挑战
该数据集旨在应对公共部门绩效与财政可持续性评估中的复杂挑战,其领域问题涉及如何从多维指标中解析国家治理效率与资源配置效益。具体而言,数据涵盖的军事支出指标需在宏观经济波动、汇率转换与统计口径差异背景下保持跨年度可比性,同时需处理极端数值范围(如负值至万亿量级)对模型稳定性的影响。在构建过程中,原始数据整合面临多重困难:世界银行与IMF等多源数据的定义不一致性可能导致指标解释偏差;历史数据缺失与异常值(如负值记录)的清洗需依赖自动化流程,难以完全校正报告误差或采样偏差。此外,数据集仅聚焦津巴布韦单一国家,限制了区域对比分析的广度,而机器学习适配中的分区策略虽固定随机种子,仍可能无法充分捕捉时间序列中的结构性断点与政策突变效应。
常用场景
经典使用场景
在公共经济学与发展研究领域,该数据集为分析津巴布韦公共部门绩效提供了结构化时序数据。研究者常利用其军事支出指标,如占GDP比重、本币与美元计值,构建计量模型以评估财政资源配置效率。通过整合1960年至2024年的国家层面聚合数据,学者能够追溯长期政策演变,并运用机器学习方法进行趋势预测与异常检测,为跨年度比较研究奠定实证基础。
实际应用
在实际政策制定层面,该数据集被国际组织与地方政府用于预算审计与可持续发展规划。世界银行等机构可依据军事支出占比的动态变化,评估津巴布韦公共资源分配的优先序,辅助设计针对性财政改革方案。同时,非政府组织借助这些指标监测安全领域投入与社会服务支出的平衡关系,为人道主义援助决策提供数据驱动的参考依据。
衍生相关工作
基于该数据集衍生的经典研究包括《军事开支与经济增长的异质性关联:来自津巴布韦的纵向证据》等实证分析。学者通过融合宏观经济变量,构建了公共部门效率评估框架,并催生了‘非洲公共财政机器学习基准测试平台’的开发。这些工作进一步拓展了面板数据建模技术在发展经济学中的应用边界,促进了跨学科方法论的融合创新。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务