electricsheepafrica/africa-eastern-africa-region-food-security-statistics-2013-2014
收藏Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/electricsheepafrica/africa-eastern-africa-region-food-security-statistics-2013-2014
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- no-annotation
language_creators:
- found
language:
- en
license: cc-by-4.0
multilinguality:
- monolingual
size_categories:
- n<1K
source_datasets:
- original
task_categories:
- tabular-classification
- tabular-regression
task_ids: []
tags:
- africa
- humanitarian
- hdx
- electric-sheep-africa
- global-acute-malnutrition-gam
- nutrition
- severe-acute-malnutrition-sam
- som
- ssd
pretty_name: "Eastern Africa Region Food Security Statistics 2013 - 2014"
dataset_info:
splits:
- name: train
num_examples: 33
- name: test
num_examples: 8
---
# Eastern Africa Region Food Security Statistics 2013 - 2014
**Publisher:** OCHA Regional Office for Southern and Eastern Africa (ROSEA) · **Source:** [HDX](https://data.humdata.org/dataset/eastern-africa-region-food-security-statistics-2013-2014) · **License:** `cc-by-igo` · **Updated:** 2023-09-28
---
## Abstract
Aggregated data on Nutrition (GAM & SAM) for Somalia and South Sudan for 2013 - 2014
Each row in this dataset represents first-level administrative unit observations. Data was last updated on HDX on 2023-09-28. Geographic scope: **SOM, SSD**.
*Curated into ML-ready Parquet format by [Electric Sheep Africa](https://huggingface.co/electricsheepafrica).*
---
## Dataset Characteristics
| | |
|---|---|
| **Domain** | Humanitarian and development data |
| **Unit of observation** | First-level administrative unit observations |
| **Rows (total)** | 42 |
| **Columns** | 9 (3 numeric, 6 categorical, 0 datetime) |
| **Train split** | 33 rows |
| **Test split** | 8 rows |
| **Geographic scope** | SOM, SSD |
| **Publisher** | OCHA Regional Office for Southern and Eastern Africa (ROSEA) |
| **HDX last updated** | 2023-09-28 |
---
## Variables
**Geographic** — `year` (range 2013.0–2014.0), `country` (Somalia, South Sudan), `region` (Mogadishu - IDP, Garowe - IDP, Berbera - IDP).
**Temporal** — `month` (Gu 2013, Deyr 2013, Gu 2014).
**Identifier / Metadata** — `source` (FSNAU May-June 2014, Nutrition Cluster SS, June 2014), `esa_source` (HDX), `esa_processed` (2026-04-11).
**Other** — `gam` (range 6.2–31.6), `sam` (range 0.3–9.7).
---
## Quick Start
```python
from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-eastern-africa-region-food-security-statistics-2013-2014")
train = ds["train"].to_pandas()
test = ds["test"].to_pandas()
print(train.shape)
train.head()
```
---
## Schema
| Column | Type | Null % | Range / Sample Values |
|---|---|---|---|
| `year` | int64 | 0.0% | 2013.0 – 2014.0 (mean 2013.4286) |
| `month` | object | 0.0% | Gu 2013, Deyr 2013, Gu 2014 |
| `country` | object | 0.0% | Somalia, South Sudan |
| `region` | object | 0.0% | Mogadishu - IDP, Garowe - IDP, Berbera - IDP |
| `gam` | float64 | 0.0% | 6.2 – 31.6 (mean 16.0881) |
| `sam` | float64 | 0.0% | 0.3 – 9.7 (mean 3.4048) |
| `source` | object | 0.0% | FSNAU May-June 2014, Nutrition Cluster SS, June 2014 |
| `esa_source` | object | 0.0% | HDX |
| `esa_processed` | object | 0.0% | 2026-04-11 |
---
## Numeric Summary
| Column | Min | Max | Mean | Median |
|---|---|---|---|---|
| `year` | 2013.0 | 2014.0 | 2013.4286 | 2013.0 |
| `gam` | 6.2 | 31.6 | 16.0881 | 15.9 |
| `sam` | 0.3 | 9.7 | 3.4048 | 3.0 |
---
## Curation
Raw data was downloaded from HDX via the CKAN API and converted to Parquet. Column names were lowercased and standardised to snake_case. Common missing-value markers (`N/A`, `null`, `none`, `-`, `unknown`, `no data`, `#N/A`) were unified to `NaN`. 1 column(s) with >80% missing values were removed: `unnamed_7`. The dataset was split 80/20 into train and test partitions using a fixed random seed (42) and saved as Snappy-compressed Parquet.
---
## Limitations
- Data originates from OCHA Regional Office for Southern and Eastern Africa (ROSEA) and has not been independently validated by ESA.
- Automated cleaning cannot correct for misreported values, definitional inconsistencies, or sampling bias in the original collection.
- This dataset spans 2 countries; geographic and methodological inconsistencies across national boundaries may affect cross-country comparability.
- Refer to the [original HDX dataset page](https://data.humdata.org/dataset/eastern-africa-region-food-security-statistics-2013-2014) for the publisher's own methodology notes and caveats.
---
## Citation
```bibtex
@dataset{hdx_africa_eastern_africa_region_food_security_statistics_2013_2014,
title = {Eastern Africa Region Food Security Statistics 2013 - 2014},
author = {OCHA Regional Office for Southern and Eastern Africa (ROSEA)},
year = {2023},
url = {https://data.humdata.org/dataset/eastern-africa-region-food-security-statistics-2013-2014},
note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)}
}
```
---
*[Electric Sheep Africa](https://huggingface.co/electricsheepafrica) — Africa's ML dataset infrastructure. Lagos, Nigeria.*
提供机构:
electricsheepafrica
搜集汇总
数据集介绍

构建方式
在非洲东部地区人道主义数据领域,该数据集的构建源于对索马里和南苏丹两国营养状况的监测需求。原始数据由联合国人道主义事务协调厅南部和东部非洲区域办公室发布,并通过人道主义数据交换平台获取。Electric Sheep Africa团队利用CKAN API下载原始资料,经过标准化清洗流程,将列名统一为蛇形命名法,并处理了缺失值标记。数据集按80/20的比例划分为训练集和测试集,采用固定随机种子确保可复现性,最终以Snappy压缩的Parquet格式存储,便于机器学习应用。
特点
该数据集聚焦于2013至2014年间非洲东部地区的粮食安全统计,涵盖索马里和南苏丹两国的一级行政区观测数据。其核心特征包括全球急性营养不良率和严重急性营养不良率两项关键营养指标,数值范围分别介于6.2%至31.6%和0.3%至9.7%之间。数据集共包含42条观测记录,涵盖地理、时间和数据来源等多维度变量,所有字段均无缺失值,保证了数据的完整性。其结构化设计特别适合开展表格分类与回归分析,为区域营养安全研究提供了精炼的实证基础。
使用方法
在应用层面,研究者可通过Hugging Face数据集库直接加载该资源。使用load_dataset函数调用相应标识符后,数据集将以标准化的训练集与测试集形式呈现,可便捷地转换为pandas DataFrame进行后续分析。典型应用场景包括建立营养指标预测模型、分析区域间营养不良率差异,以及评估人道主义干预措施效果。需要注意的是,由于数据来源于不同国家的统计体系,进行跨国比较时应考虑方法论差异,建议参考原始发布机构的技术说明以确保分析严谨性。
背景与挑战
背景概述
在非洲东部地区,粮食安全与营养状况一直是国际人道主义与发展领域关注的核心议题。该数据集由联合国人道主义事务协调厅南部与东部非洲区域办公室于2023年发布,聚焦于索马里和南苏丹在2013至2014年间的全球急性营养不良与严重急性营养不良统计数据。其创建旨在为研究人员和政策制定者提供标准化的行政单位观测数据,以支持区域粮食安全评估与干预策略的制定。该数据集通过Electric Sheep Africa机构进行机器学习友好型重构,促进了人道主义数据分析与机器学习应用的交叉融合,为区域营养监测与预测模型的发展提供了关键数据基础。
当前挑战
该数据集致力于解决人道主义领域中粮食安全与营养状况的监测与评估问题,其核心挑战在于如何从有限且异构的原始数据中提取可靠指标以支持跨区域比较与趋势分析。在构建过程中,数据采集面临地理与方法学不一致的难题,例如不同国家或地区在营养不良定义与测量标准上可能存在差异,影响数据的可比性与一致性。此外,数据集规模较小,仅包含42条观测记录,可能限制复杂统计模型或机器学习算法的训练效果。原始数据中的缺失值与报告偏差亦需通过严谨的清洗流程处理,但自动化方法难以完全纠正定义不一致或抽样偏差等深层问题。
常用场景
经典使用场景
在非洲人道主义与发展研究领域,该数据集常被用于构建营养安全监测模型。研究者利用其包含的全球急性营养不良(GAM)与严重急性营养不良(SAM)指标,结合年份、月份、国家及地区等特征,训练分类或回归模型,以预测特定行政区域在特定季节的营养危机风险。这种应用有助于揭示索马里和南苏丹在2013至2014年间营养状况的时空分布规律,为早期预警系统提供数据支撑。
衍生相关工作
围绕该数据集衍生的经典工作包括基于机器学习的营养危机预测框架,如利用回归模型估算未观测地区的GAM值。此外,研究者将其与气候、冲突数据融合,开发了多风险预警系统。这些工作扩展了人道主义数据分析的边界,促进了‘数据驱动型援助’范式的形成,并为后续更广泛的非洲粮食安全数据集(如IPC分类数据)的整合奠定了基础。
数据集最近研究
最新研究方向
在非洲人道主义数据分析领域,该数据集聚焦于2013至2014年索马里和南苏丹的营养安全指标,涵盖全球急性营养不良与严重急性营养不良的统计。前沿研究正利用此类小规模但高价值的表格数据,探索机器学习模型在资源受限环境下的应用,特别是通过集成学习与迁移学习技术,提升对区域粮食危机风险的预测精度。相关热点事件包括非洲之角持续的气候变化与冲突导致的粮食不安全状况,促使学界更加关注历史数据的纵向分析与跨区域模式识别。这些研究不仅为早期预警系统提供数据支撑,也推动了人道主义干预措施的精准化,对全球可持续发展目标中的零饥饿议题具有实证意义。
以上内容由遇见数据集搜集并总结生成



