five

electricsheepafrica/africa-world-bank-climate-change-indicators-for-eswatini

收藏
Hugging Face2026-04-10 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-world-bank-climate-change-indicators-for-eswatini
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - no-annotation language_creators: - found language: - en license: cc-by-4.0 multilinguality: - monolingual size_categories: - 1K<n<10K source_datasets: - original task_categories: - tabular-classification - tabular-regression task_ids: [] tags: - africa - humanitarian - hdx - electric-sheep-africa - climate-weather - indicators - swz pretty_name: "Eswatini - Climate Change" dataset_info: splits: - name: train num_examples: 1166 - name: test num_examples: 291 --- # Eswatini - Climate Change **Publisher:** World Bank Group · **Source:** [HDX](https://data.humdata.org/dataset/world-bank-climate-change-indicators-for-eswatini) · **License:** `cc-by` · **Updated:** 2026-03-27 --- ## Abstract Contains data from the World Bank's [data portal](http://data.worldbank.org/). There is also a [consolidated country dataset](https://data.humdata.org/dataset/world-bank-combined-indicators-for-eswatini) on HDX. Climate change is expected to hit developing countries the hardest. Its effects—higher temperatures, changes in precipitation patterns, rising sea levels, and more frequent weather-related disasters—pose risks for agriculture, food, and water supplies. At stake are recent gains in the fight against poverty, hunger and disease, and the lives and livelihoods of billions of people in developing countries. Addressing climate change requires unprecedented global cooperation across borders. The World Bank Group is helping support developing countries and contributing to a global solution, while tailoring our approach to the differing needs of developing country partners. Data here cover climate systems, exposure to climate impacts, resilience, greenhouse gas emissions, and energy use. Other indicators relevant to climate change are found under other data pages, particularly Environment, Agriculture & Rural Development, Energy & Mining, Health, Infrastructure, Poverty, and Urban Development. Each row in this dataset represents country-level aggregates. Data was last updated on HDX on 2026-03-27. Geographic scope: **SWZ**. *Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).* --- ## Dataset Characteristics | | | |---|---| | **Domain** | Food security and nutrition | | **Unit of observation** | Country-level aggregates | | **Rows (total)** | 1,458 | | **Columns** | 8 (2 numeric, 6 categorical, 0 datetime) | | **Train split** | 1,166 rows | | **Test split** | 291 rows | | **Geographic scope** | SWZ | | **Publisher** | World Bank Group | | **HDX last updated** | 2026-03-27 | --- ## Variables **Geographic** — `country_name` (Eswatini), `country_iso3` (SWZ), `year` (range 1960.0–2024.0). **Outcome / Measurement** — `value` (range -2.8–303340000.0). **Identifier / Metadata** — `indicator_name` (Agriculture, forestry, and fishing, value added (% of GDP), Urban population (% of total population), Urban population), `indicator_code` (NV.AGR.TOTL.ZS, SP.URB.TOTL.IN.ZS, SP.URB.TOTL), `esa_source` (HDX), `esa_processed` (2026-04-10). --- ## Quick Start ```python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-world-bank-climate-change-indicators-for-eswatini") train = ds["train"].to_pandas() test = ds["test"].to_pandas() print(train.shape) train.head() ``` --- ## Schema | Column | Type | Null % | Range / Sample Values | |---|---|---|---| | `country_name` | object | 0.0% | Eswatini | | `country_iso3` | object | 0.0% | SWZ | | `year` | int64 | 0.0% | 1960.0 – 2024.0 (mean 1998.1934) | | `indicator_name` | object | 0.0% | Agriculture, forestry, and fishing, value added (% of GDP), Urban population (% of total population), Urban population | | `indicator_code` | object | 0.0% | NV.AGR.TOTL.ZS, SP.URB.TOTL.IN.ZS, SP.URB.TOTL | | `value` | float64 | 0.0% | -2.8 – 303340000.0 (mean 2610620.4021) | | `esa_source` | object | 0.0% | HDX | | `esa_processed` | object | 0.0% | 2026-04-10 | --- ## Numeric Summary | Column | Min | Max | Mean | Median | |---|---|---|---|---| | `year` | 1960.0 | 2024.0 | 1998.1934 | 2001.0 | | `value` | -2.8 | 303340000.0 | 2610620.4021 | 54.3 | --- ## Curation Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet. --- ## Limitations - Data originates from World Bank Group and has not been independently validated by ESA. - Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection. - Refer to the [original HDX dataset page](https://data.humdata.org/dataset/world-bank-climate-change-indicators-for-eswatini) for the publisher's own methodology notes and caveats. --- ## Citation ```bibtex @dataset{hdx_africa_world_bank_climate_change_indicators_for_eswatini, title = {Eswatini - Climate Change}, author = {World Bank Group}, year = {2026}, url = {https://data.humdata.org/dataset/world-bank-climate-change-indicators-for-eswatini}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} } ``` --- *[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自世界银行集团的气候变化指标,原始数据通过人道主义数据交换(HDX)平台的CKAN API获取,并由Electric Sheep Africa团队进行精加工。构建过程中,原始数据被转换为Parquet格式,列名被统一转换为小写蛇形命名法,常见缺失值标记(如N/A、null等)被统一替换为NaN。最终,数据集采用固定随机种子42,以80/20的比例划分为训练集与测试集,并保存为Snappy压缩的Parquet文件,确保了数据在机器学习任务中的高效加载与处理。
使用方法
使用者可通过HuggingFace的datasets库便捷加载该数据集,使用`load_dataset`函数即可获取训练集与测试集,并轻松转换为Pandas DataFrame进行后续分析。数据集适用于表格分类与回归任务,例如预测气候变化指标的时间序列趋势或探究不同指标间的关联性。建议用户在建模前深入了解世界银行集团原始数据的方法论注释与局限性,以避免因自动清洗无法纠正的误报值或定义不一致而引入偏差,同时可结合其他环境、农业或健康相关指标进行更全面的气候变化影响评估。
背景与挑战
背景概述
Eswatini气候变化指标数据集由世界银行集团编制,经由人道主义数据交换平台(HDX)发布,并经过Electric Sheep Africa团队在2026年重新整理为机器学习就绪的Parquet格式。该数据集聚焦于斯威士兰这一南部非洲国家,收录了从1960年至2024年间涵盖农业、城市化、温室气体排放及能源使用等关键气候相关指标的国家级聚合数据。其核心研究问题在于量化气候变化对发展中国家脆弱生态与社会经济系统的冲击,尤其是对近期在消除贫困、饥饿与疾病方面所获成果的潜在威胁。该数据集为政策制定者、气候科学家及机器学习研究者提供了标准化的时序指标,成为评估非洲小国气候韧性、模拟适应策略及验证全球气候模型的重要基准资源,在跨学科气候-发展研究中具有显著影响力。
当前挑战
该数据集面临的核心领域挑战在于气候变化影响的高度复杂性:发展中国家的农业、水资源与公共卫生系统对气候波动极为敏感,而现有指标难以捕捉局部微气候效应、社会适应能力差异以及数据稀疏性带来的建模偏差。构建过程中,原始数据来源依赖世界银行多国统计体系,面临跨年份定义不一致、部分指标缺失及极值异常(如value列范围从-2.8至3.03亿)等问题;自动化清洗虽统一了缺失标记,但无法纠正误报值或样本选择偏倚。此外,数据集仅包含8个字段,且特征多为类别变量,预测气候变化相关经济指标时面临维度稀疏与非线性关系拟合的挑战,亟需整合更高分辨率的地理空间数据与动态模拟技术以增强模型的因果推断能力。
常用场景
经典使用场景
在气候变化对发展中国家影响日益严峻的背景下,Eswatini气候变化指标数据集为研究脆弱经济体与气候变量之间的交互关系提供了珍贵的数据基础。该数据集汇集了世界银行集团关于斯威士兰的气温变化、降水模式、农业附加值(占GDP百分比)、城市人口比重以及能源利用等多维指标,覆盖1960年至2024年的年度国家层面聚合数据。研究者可借助此数据集开展时间序列预测、趋势分析与回归建模,探究气候变化对农业生产、水资源安全及城市化进程的长期影响,也可将其作为分类或回归任务的基准数据集,评估不同机器学习模型在气候指标预测中的表现。
解决学术问题
该数据集有效解决了发展中国家层面气候变化研究中长期存在的数据碎片化与标准化不足的问题。传统上,斯威士兰等非洲国家的气候数据分散于多个国际机构,且格式不统一,难以直接用于定量分析。通过整合世界银行的核心气候指标并以机器可读的Parquet格式呈现,该数据集使学者能够系统性地量化气候变化对农业经济占比、城乡人口分布及温室气体排放等关键社会经济变量的影响。这为验证气候弹性理论、识别脆弱性热点区域以及评估气候适应政策的有效性提供了可复现的数据支撑,推动了非洲气候科学从描述性分析向预测性建模的范式转变。
实际应用
在实际应用层面,该数据集为国际发展机构与政策制定者提供了数据驱动的决策支持工具。人道主义组织可基于历史气候指标与农业产出的关联模式,优化针对斯威士兰的粮食安全预警系统与资源分配策略。世界银行及各国环保部门可利用该数据定期评估国家气候行动计划的进展,例如追踪城市人口增速与碳排放强度之间的动态关系。此外,数据集的规范化格式使其易于集成至非洲大陆的多国气候监测平台,支持区域联防联控机制的建立,为应对极端天气事件与保障粮食供应链韧性提供了从数据采集到模型部署的端到端解决方案。
数据集最近研究
最新研究方向
该数据集聚焦于世界银行提供的斯威士兰气候变化指标,涵盖温度、降水、温室气体排放及能源使用等关键变量,为机器学习驱动的非洲气候变化影响评估提供了结构化时序数据。当前前沿方向包括利用该数据训练回归与分类模型,预测极端天气事件对农业、粮食安全及城市化的冲击;结合卫星遥感与深度学习,验证全球气候模型在撒哈拉以南非洲的降尺度效果;以及探索因果推断方法量化气候政策对贫困与疾病防控的长期效应。该数据集填补了非洲小国高分辨率气候社会经济数据的空白,支撑国际组织与学者开展可复现的脆弱性研究,助力全球气候正义与可持续发展目标的科学决策。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务