five

electricsheepafrica/africa-world-bank-agriculture-and-rural-development-indicators-for-gabon

收藏
Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-agriculture-and-rural-development-indicators-for-gabon
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - no-annotation language_creators: - found language: - en license: cc-by-4.0 multilinguality: - monolingual size_categories: - 1K<n<10K source_datasets: - original task_categories: - tabular-regression task_ids: [] tags: - africa - humanitarian - hdx - electric-sheep-africa - agriculture-livestock - development - indicators - gab pretty_name: "Gabon - Agriculture and Rural Development" dataset_info: splits: - name: train num_examples: 1352 - name: test num_examples: 338 --- # Gabon - Agriculture and Rural Development **Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-agriculture-and-rural-development-indicators-for-gabon) · **License:** `cc-by` · **Updated:** 2026-03-27 --- ## Abstract Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-gabon) on HDX. For the 70 percent of the world's poor who live in rural areas, agriculture is the main source of income and employment. But depletion and degradation of land and water pose serious challenges to producing enough food and other agricultural products to sustain livelihoods here and meet the needs of urban populations. Data presented here include measures of agricultural inputs, outputs, and productivity compiled by the UN's Food and Agriculture Organization. Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **GAB**. *Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).* --- ## Dataset Characteristics | | | |---|---| | **Domain** | Food security and nutrition | | **Unit of observation** | Country-level aggregates | | **Rows (total)** | 1,691 | | **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) | | **Train split** | 1,352 rows | | **Test split** | 338 rows | | **Geographic scope** | GAB | | **Publisher** | World Bank Group | | **HDX last updated** | 2026-03-27 | --- ## Variables **Geographic** — `country_name` (Gabon), `country_iso3` (GAB), `year` (range 1960.0–2025.0). **Outcome / Measurement** — `value` (range -2.6247–1370578110.8019). **Identifier / Metadata** — `indicator_name` (Rural population, Agriculture, forestry, and fishing, value added (current US$), Agriculture, forestry, and fishing, value added (% of GDP)), `indicator_code` (SP.RUR.TOTL, NV.AGR.TOTL.CD, NV.AGR.TOTL.ZS), `esa_source` (HDX), `esa_processed` (2026-04-11). --- ## Quick Start ```python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-world-bank-agriculture-and-rural-development-indicators-for-gabon") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() ``` --- ## Schema | Column | Type | Null % | Range / Sample Values | |---|---|---|---| | `country_name` | object | 0.0% | Gabon | | `country_iso3` | object | 0.0% | GAB | | `year` | int64 | 0.0% | 1960.0 – 2025.0 (mean 1994.5163) | | `indicator_name` | object | 0.0% | Rural population, Agriculture, forestry, and fishing, value added (current US$), Agriculture, forestry, and fishing, value added (% of GDP) | | `indicator_code` | object | 0.0% | SP.RUR.TOTL, NV.AGR.TOTL.CD, NV.AGR.TOTL.ZS | | `value` | float64 | 0.0% | -2.6247 – 1370578110.8019 (mean 15698275.0615) | | `esa_source` | object | 0.0% | HDX | | `esa_processed` | object | 0.0% | 2026-04-11 | --- ## Numeric Summary | Column | Min | Max | Mean | Median | |---|---|---|---|---| | `year` | 1960.0 | 2025.0 | 1994.5163 | 1996.0 | | `value` | -2.6247 | 1370578110.8019 | 15698275.0615 | 64.84 | --- ## Curation Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet. --- ## Limitations - Data originates from World Bank Group and has not been independently validated by ESA. - Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection. - Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-agriculture-and-rural-development-indicators-for-gabon) for the publisher's own methodology notes and caveats. --- ## Citation ```bibtex @dataset{hdx_africa_world_bank_agriculture_and_rural_development_indicators_for_gabon, title = {Gabon - Agriculture and Rural Development}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-agriculture-and-rural-development-indicators-for-gabon}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } ``` --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
在农业与农村发展领域,数据集的构建往往依赖于权威国际机构的系统性数据收集。本数据集源自世界银行集团的数据门户,通过人道主义数据交换平台获取原始资料,并由Electric Sheep Africa团队进行专业化处理。构建过程涉及从CKAN API下载原始数据,随后进行格式转换与标准化处理,包括列名的小写与蛇形命名法统一。缺失值标记被规范化为NaN,以确保数据一致性。最终,数据集按照80:20的比例划分为训练集与测试集,采用固定随机种子以保证可复现性,并以Snappy压缩的Parquet格式存储,为机器学习应用提供高效支持。
使用方法
在应用层面,该数据集主要服务于表格回归任务,适用于农业经济预测与发展政策分析。用户可通过Hugging Face的datasets库直接加载,利用Python环境快速访问训练与测试分区。数据以Pandas DataFrame格式呈现,便于进行探索性分析与特征工程。研究者可依据年份、指标代码等维度筛选数据,针对特定农业经济变量建模,评估农村发展趋势。需要注意的是,数据源自世界银行,使用时需参考原发布方的方法学说明,以理解潜在的定义差异与收集偏差。数据集以开放许可发布,支持学术与政策研究中的透明复用。
背景与挑战
背景概述
在农业与农村发展研究领域,系统性的数据收集对于理解发展中国家经济转型至关重要。世界银行集团于2026年发布了加蓬农业与农村发展指标数据集,由Electric Sheep Africa机构进行机器学习格式的整理与发布。该数据集聚焦于加蓬的农业经济核心指标,涵盖1960年至2025年间农村人口、农业增加值及其占GDP比重等关键变量,旨在为粮食安全与营养领域的政策分析提供实证基础。其创建响应了全球对非洲农业可持续发展数据的需求,通过结构化呈现国家层面的时间序列数据,为农村贫困、资源退化等复杂问题的量化研究提供了重要支撑。
当前挑战
该数据集致力于解决农业经济指标预测与趋势分析的挑战,其核心任务在于从有限的国家级时间序列数据中捕捉农业发展的长期规律与突变特征。构建过程中面临多重挑战:原始数据源自世界银行,可能存在报告偏差或定义不一致问题,自动化清洗难以修正深层的数据收集误差;指标数值跨度极大,从负值到十亿量级,对回归模型的稳健性构成考验;数据集仅涵盖单一国家,样本规模有限,且时间跨度长达六十五年,期间经济结构变迁可能引发指标分布的非平稳性,增加了机器学习建模的复杂性。
常用场景
经典使用场景
在农业经济学与发展研究领域,该数据集常被用于构建时间序列回归模型,以分析加蓬农业与农村发展指标的长期演变趋势。研究者利用其包含的乡村人口、农业增加值等关键变量,通过机器学习方法预测农业产值占GDP的比重变化,评估政策干预对农村经济的影响,为理解农业在国民经济中的结构性角色提供量化依据。
解决学术问题
该数据集有效解决了发展经济学中关于农业转型与农村贫困的实证研究难题。通过提供1960年至2025年加蓬的标准化农业指标,学者能够检验农业生产力与经济增长的理论假设,量化自然资源退化对农业产出的影响,并验证联合国可持续发展目标中零饥饿与可持续农业的相关政策效果,填补了非洲法语国家精细化农业数据研究的空白。
实际应用
在实际应用层面,该数据集为国际组织与加蓬政府制定农村发展战略提供了决策支持。世界银行与粮农组织可依据农业增加值的时间序列数据,优化农业信贷分配方案;非政府组织则能结合乡村人口指标,精准定位农村基础设施投资区域,从而提升粮食安全干预措施的有效性,助力乡村振兴与包容性增长目标的实现。
数据集最近研究
最新研究方向
在农业与农村发展领域,数据驱动的政策分析正成为研究热点。该数据集聚焦加蓬的农业与农村发展指标,为探索气候变化对农业产出的影响、农村人口变迁与经济发展关联提供了关键数据支撑。前沿研究利用此类时序数据构建预测模型,评估可持续农业政策的长期效应,助力应对全球粮食安全挑战。这些分析不仅深化了对非洲农业转型的理解,也为国际发展机构制定精准干预措施提供了实证依据。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务