five

electricsheepafrica/africa-world-bank-trade-indicators-for-zimbabwe

收藏
Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-trade-indicators-for-zimbabwe
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - no-annotation language_creators: - found language: - en license: cc-by-4.0 multilinguality: - monolingual size_categories: - 1K<n<10K source_datasets: - original task_categories: - tabular-classification - tabular-regression task_ids: [] tags: - africa - humanitarian - hdx - electric-sheep-africa - indicators - trade - zwe pretty_name: "Zimbabwe - Trade" dataset_info: splits: - name: train num_examples: 3358 - name: test num_examples: 839 --- # Zimbabwe - Trade **Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-trade-indicators-for-zimbabwe) · **License:** `cc-by` · **Updated:** 2026-03-27 --- ## Abstract Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-zimbabwe) on HDX. Trade is a key means to fight poverty and achieve the Millennium Development Goals, specifically by improving developing country access to markets, and supporting a rules based, predictable trading system. In cooperation with other international development partners, the World Bank launched the Transparency in Trade Initiative to provide free and easy access to data on country-specific trade policies. Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **ZWE**. *Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).* --- ## Dataset Characteristics | | | |---|---| | **Domain** | Poverty and economic vulnerability | | **Unit of observation** | Country-level aggregates | | **Rows (total)** | 4,198 | | **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) | | **Train split** | 3,358 rows | | **Test split** | 839 rows | | **Geographic scope** | ZWE | | **Publisher** | World Bank Group | | **HDX last updated** | 2026-03-27 | --- ## Variables **Geographic** — `country_name` (Zimbabwe), `country_iso3` (ZWE), `year` (range 1960.0–2024.0). **Outcome / Measurement** — `value` (range -4402366967.1392–22074260817.5123). **Identifier / Metadata** — `indicator_name` (Merchandise trade (% of GDP), Merchandise imports (current US$), Merchandise exports (current US$)), `indicator_code` (TG.VAL.TOTL.GD.ZS, TM.VAL.MRCH.CD.WT, TX.VAL.MRCH.CD.WT), `esa_source` (HDX), `esa_processed` (2026-04-11). --- ## Quick Start ```python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-world-bank-trade-indicators-for-zimbabwe") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() ``` --- ## Schema | Column | Type | Null % | Range / Sample Values | |---|---|---|---| | `country_name` | object | 0.0% | Zimbabwe | | `country_iso3` | object | 0.0% | ZWE | | `year` | int64 | 0.0% | 1960.0 – 2024.0 (mean 2001.4474) | | `indicator_name` | object | 0.0% | Merchandise trade (% of GDP), Merchandise imports (current US$), Merchandise exports (current US$) | | `indicator_code` | object | 0.0% | TG.VAL.TOTL.GD.ZS, TM.VAL.MRCH.CD.WT, TX.VAL.MRCH.CD.WT | | `value` | float64 | 0.0% | -4402366967.1392 – 22074260817.5123 (mean 539633016.6936) | | `esa_source` | object | 0.0% | HDX | | `esa_processed` | object | 0.0% | 2026-04-11 | --- ## Numeric Summary | Column | Min | Max | Mean | Median | |---|---|---|---|---| | `year` | 1960.0 | 2024.0 | 2001.4474 | 2003.0 | | `value` | -4402366967.1392 | 22074260817.5123 | 539633016.6936 | 30.0528 | --- ## Curation Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet. --- ## Limitations - Data originates from World Bank Group and has not been independently validated by ESA. - Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection. - Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-trade-indicators-for-zimbabwe) for the publisher's own methodology notes and caveats. --- ## Citation ```bibtex @dataset{hdx_africa_world_bank_trade_indicators_for_zimbabwe, title = {Zimbabwe - Trade}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-trade-indicators-for-zimbabwe}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } ``` --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在贸易与发展经济学领域,数据集的构建通常依赖于权威国际机构的统计汇编。本数据集源自世界银行集团的公开数据门户,通过人道主义数据交换平台获取原始资料,并由Electric Sheep Africa团队进行专业化处理。构建过程涉及从CKAN API下载原始数据,随后进行格式转换与标准化清洗,包括统一列名格式为蛇形命名法,并将各类缺失值标记统一为NaN。最终,采用固定随机种子将数据按80:20的比例划分为训练集与测试集,并以Snappy压缩的Parquet格式存储,确保了数据的机器学习可用性与结构一致性。
特点
该数据集聚焦于津巴布韦的贸易指标,体现了宏观经济监测的典型特征。其核心特点在于以国家层面聚合数据为观测单位,涵盖1960年至2024年的长时间序列,包含商品贸易占GDP比重、商品进出口额等关键指标。数据结构简洁明晰,共8个变量,其中数值型与分类型变量分布均衡,且无缺失值,保证了分析的完整性。数据集经过精心划分,训练集与测试集分别包含3358和839条记录,为模型训练与评估提供了可靠基础。地理范围严格限定于津巴布韦,指标代码遵循世界银行标准,增强了数据的可比性与可追溯性。
使用方法
在应用机器学习方法研究贸易经济问题时,本数据集提供了便捷的接入途径。使用者可通过Hugging Face的datasets库直接加载数据,利用load_dataset函数调用相应名称即可获取已分割的训练集与测试集。数据以Pandas DataFrame格式呈现,便于进行探索性分析与特征工程。典型工作流程包括加载数据、转换为DataFrame结构、查验数据形状与预览内容,随后可针对年份、指标类型等变量开展回归或分类建模。由于数据已预先清洗与标准化,研究者可专注于模型构建与结果阐释,但需注意原始数据的方法论局限,并参考世界银行的官方说明以确保分析严谨性。
背景与挑战
背景概述
在全球化与经济发展研究领域,贸易数据作为衡量国家经济健康与融入世界经济体系的关键指标,长期受到国际组织与学术界的重视。世界银行集团作为全球发展数据的重要提供者,于2026年发布了针对津巴布韦的贸易指标数据集,该数据集由Electric Sheep Africa机构进行机器学习友好型重构,涵盖了自1960年至2024年的国家层面聚合数据。该数据集的核心研究问题聚焦于通过贸易透明度促进减贫与实现千年发展目标,旨在为政策制定者与研究人员提供关于津巴布韦商品贸易占GDP比重、进出口额等关键指标的标准化时间序列数据,从而支持对发展中国家市场准入与贸易规则体系的深入分析。
当前挑战
该数据集致力于解决宏观经济与贸易政策分析中的核心挑战,即如何从复杂多变的国家级贸易数据中提取可靠模式,以预测经济脆弱性并评估减贫策略的有效性。然而,构建过程中面临多重挑战:原始数据依赖于世界银行的统计汇编,可能存在报告误差、定义不一致或采样偏差,而自动化清洗流程难以纠正这些根本性问题;同时,数据的时间跨度长达数十年,期间津巴布韦经历了显著的经济结构变化与外部冲击,如何确保跨时期指标的可比性与一致性成为关键难点。此外,将异构的原始数据转换为机器学习可用的表格形式时,需在保持数据完整性的前提下统一缺失值标记与列名标准化,这对数据工程的严谨性提出了较高要求。
常用场景
经典使用场景
在经济学与发展研究领域,贸易数据是评估国家经济开放度与全球化参与的关键指标。该数据集以津巴布韦为案例,系统收录了1960年至2024年间商品贸易占GDP比重、进出口额等核心指标,为学者提供了长期、连续的时间序列数据。其经典使用场景在于构建计量经济模型,分析贸易政策变化、外部冲击(如汇率波动或国际制裁)对津巴布韦宏观经济的影响,并通过训练集与测试集的划分,支持机器学习方法在贸易预测与模式识别中的应用。
解决学术问题
该数据集直接回应了发展经济学中关于贸易与经济增长关系的经典议题,尤其为研究小型开放经济体在结构性约束下的贸易动态提供了实证基础。它解决了数据可及性与标准化问题,使研究者能够检验贸易自由化、区域一体化协议对津巴布韦经济脆弱性的影响,并量化贸易波动与贫困指标之间的关联。其意义在于通过高质量、机器可读的数据格式,促进了跨学科研究,为政策评估与可持续发展目标(SDGs)的监测提供了可靠的数据支撑。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在两类研究脉络:一是基于时间序列分析的贸易预测模型,例如使用ARIMA或LSTM网络预测津巴布韦未来贸易流量,并发表于发展经济学期刊;二是政策效果评估研究,学者常将其与外部数据集(如贫困率、就业统计)链接,运用双重差分法等因果推断技术,量化特定贸易改革对经济增长的净效应。这些工作不仅深化了对津巴布韦经济转型的理解,也为机器学习在结构化经济数据中的应用开辟了新路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作