five

electricsheepafrica/africa-world-bank-aid-effectiveness-indicators-for-gabon

收藏
Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-aid-effectiveness-indicators-for-gabon
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - no-annotation language_creators: - found language: - en license: cc-by-4.0 multilinguality: - monolingual size_categories: - 1K<n<10K source_datasets: - original task_categories: - tabular-classification task_ids: [] tags: - africa - humanitarian - hdx - electric-sheep-africa - aid-effectiveness - indicators - gab pretty_name: "Gabon - Aid Effectiveness" dataset_info: splits: - name: train num_examples: 1598 - name: test num_examples: 399 --- # Gabon - Aid Effectiveness **Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-aid-effectiveness-indicators-for-gabon) · **License:** `cc-by` · **Updated:** 2026-03-27 --- ## Abstract Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-gabon) on HDX. Aid effectiveness is the impact that aid has in reducing poverty and inequality, increasing growth, building capacity, and accelerating achievement of the Millennium Development Goals set by the international community. Indicators here cover aid received as well as progress in reducing poverty and improving education, health, and other measures of human welfare. Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **GAB**. *Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).* --- ## Dataset Characteristics | | | |---|---| | **Domain** | Public health | | **Unit of observation** | Country-level aggregates | | **Rows (total)** | 1,998 | | **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) | | **Train split** | 1,598 rows | | **Test split** | 399 rows | | **Geographic scope** | GAB | | **Publisher** | World Bank Group | | **HDX last updated** | 2026-03-27 | --- ## Variables **Geographic** — `country_name` (Gabon), `country_iso3` (GAB), `year` (range 1960.0–2025.0). **Outcome / Measurement** — `value` (range -48849998.4741–260408294.6777). **Identifier / Metadata** — `indicator_name` (Net migration, Net bilateral aid flows from DAC donors, Total (current US$), Mortality rate, under-5 (per 1,000 live births)), `indicator_code` (SM.POP.NETM, DC.DAC.TOTL.CD, SH.DYN.MORT), `esa_source` (HDX), `esa_processed` (2026-04-11). --- ## Quick Start ```python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-world-bank-aid-effectiveness-indicators-for-gabon") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() ``` --- ## Schema | Column | Type | Null % | Range / Sample Values | |---|---|---|---| | `country_name` | object | 0.0% | Gabon | | `country_iso3` | object | 0.0% | GAB | | `year` | int64 | 0.0% | 1960.0 – 2025.0 (mean 1996.2618) | | `indicator_name` | object | 0.0% | Net migration, Net bilateral aid flows from DAC donors, Total (current US$), Mortality rate, under-5 (per 1,000 live births) | | `indicator_code` | object | 0.0% | SM.POP.NETM, DC.DAC.TOTL.CD, SH.DYN.MORT | | `value` | float64 | 0.0% | -48849998.4741 – 260408294.6777 (mean 16558794.6741) | | `esa_source` | object | 0.0% | HDX | | `esa_processed` | object | 0.0% | 2026-04-11 | --- ## Numeric Summary | Column | Min | Max | Mean | Median | |---|---|---|---|---| | `year` | 1960.0 | 2025.0 | 1996.2618 | 1998.0 | | `value` | -48849998.4741 | 260408294.6777 | 16558794.6741 | 239999.9946 | --- ## Curation Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet. --- ## Limitations - Data originates from World Bank Group and has not been independently validated by ESA. - Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection. - Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-aid-effectiveness-indicators-for-gabon) for the publisher's own methodology notes and caveats. --- ## Citation ```bibtex @dataset{hdx_africa_world_bank_aid_effectiveness_indicators_for_gabon, title = {Gabon - Aid Effectiveness}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-aid-effectiveness-indicators-for-gabon}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } ``` --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在评估国际发展援助成效的宏观背景下,该数据集由世界银行集团发布,并由Electric Sheep Africa团队进行专业化整理。原始数据通过HDX平台的CKAN API获取,经过系统的数据清洗流程,包括统一列名格式为蛇形命名法、将各类缺失值标记标准化为NaN。随后,采用固定的随机种子将数据按80:20的比例划分为训练集与测试集,最终以Snappy压缩的Parquet格式存储,确保了数据的结构规整与机器学习任务的就绪性。
特点
该数据集聚焦于加蓬的国家级援助成效指标,涵盖了从1960年至2025年的长时间序列观测。其核心特征在于整合了多元化的指标维度,包括净移民、双边援助资金流以及五岁以下儿童死亡率等关键发展度量。数据以表格形式呈现,共包含8个字段,兼具数值型与分类型变量,且无缺失值,为量化分析提供了高完整性的面板数据基础。地理范围严格限定于加蓬,使得研究能够深入剖析单一国家的发展轨迹与援助干预的关联。
使用方法
在应用层面,该数据集主要服务于表格分类等机器学习任务,尤其适合用于发展成效的预测或模式识别研究。使用者可通过Hugging Face的`datasets`库便捷加载,并利用`to_pandas`方法转换为DataFrame进行后续分析。数据已预分割为训练集与测试集,便于直接投入模型开发与验证流程。研究者可依据`indicator_code`与`year`等字段进行纵向或横向分析,探索援助资金与人类发展指标间的动态关系,但需注意援引原始发布方的方法论说明以理解数据局限。
背景与挑战
背景概述
在全球化发展议程中,援助有效性评估是国际发展合作的核心议题,旨在衡量外部援助对受援国减贫、经济增长及人类福祉提升的实际影响。世界银行集团作为全球发展数据的重要权威机构,系统性地收集并发布了各国援助有效性指标,为政策制定与学术研究提供了关键量化依据。该数据集由Electric Sheep Africa于2026年重新整理并发布,聚焦于加蓬这一中非国家,涵盖了自1960年至2025年间的跨国援助流动、人口迁移及公共健康等多维度指标,以国家层面聚合数据形式呈现,为机器学习在发展经济学领域的应用提供了结构化资源。
当前挑战
评估援助有效性的核心挑战在于如何精准量化外部援助与受援国发展成果之间的因果关系,这涉及复杂的混杂变量控制与长期效应追踪。数据集构建过程中,原始数据可能存在报告不一致、定义差异及采样偏差等问题,自动化清洗流程难以修正深层的测量误差。此外,指标涵盖范围从经济援助到健康结局,跨领域整合要求对多维时间序列进行一致性处理,而国家层面聚合数据可能掩盖了国内异质性,限制了微观机制的分析深度。
常用场景
经典使用场景
在公共政策与发展经济学领域,该数据集为研究加蓬的援助有效性提供了结构化时序数据。经典使用场景涉及利用机器学习模型分析援助流动与人类福祉指标间的关联,例如通过回归或分类方法预测援助对减贫、教育或健康成果的影响。研究人员常将年份、指标代码和数值作为特征,构建监督学习任务,以评估不同援助策略的长期效果,从而为政策优化提供数据驱动的见解。
实际应用
在实际应用中,该数据集被国际组织、政府机构及非营利组织用于监测和评估对加蓬的发展援助项目。例如,决策者可利用数据追踪援助资金流向与健康、教育成果的同步变化,优化资源分配策略。同时,数据科学家可构建预警模型,基于历史趋势预测未来援助需求或识别潜在的发展瓶颈,从而提升援助项目的针对性和效率,支持加蓬实现可持续发展目标。
衍生相关工作
该数据集衍生了多项经典研究工作,主要集中在机器学习与计量经济学的交叉领域。例如,学者利用其训练时间序列预测模型,以预估援助对儿童死亡率的影响;亦有研究应用因果推断方法,如双重差分模型,分析特定援助干预的效果。这些工作扩展了数据在政策模拟和影响评估中的应用,促进了开源工具在非洲发展研究中的普及,为类似国别数据集的分析提供了方法论参考。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务