africa-fewsnet-staple-food-price-data-for-somalia-monthly-133
收藏Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-fewsnet-staple-food-price-data-for-somalia-monthly-133
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为“索马里月度FEWS NET主食价格数据”,由FEWS NET自1995年起收集,包含索马里国家层面的主食价格数据。数据集涵盖食品安全和营养领域,共91,372行数据,分为73,097行的训练集和18,274行的测试集。数据包含18个字段,其中3个数值型、14个分类型和1个日期时间型。地理范围限定为索马里(SOM),数据包括国家、行政区、经纬度、市场、产品、价格类型、来源、单位等信息。数据集经过清洗和标准化处理,转换为Parquet格式,适用于表格回归等机器学习任务。数据来源于HDX平台,由Electric Sheep Africa进行整理和发布。使用该数据集时需注意原始数据可能存在报告错误、定义不一致或采样偏差等问题。
创建时间:
2026-04-09
原始信息汇总
数据集概述:Somalia Monthly FEWS NET Staple Food Price Data
基本信息
- 数据集名称:Somalia Monthly FEWS NET Staple Food Price Data
- 发布方:FEWS NET
- 数据来源:https://data.humdata.org/dataset/fewsnet_staple_food_price_data_for_somalia_monthly_133
- 许可证:cc-by-4.0
- 最后更新日期:2026-04-01
- 语言:英语
- 数据规模:10K<n<100K
- 任务类别:表格回归、其他
- 标签:africa, humanitarian, hdx, electric-sheep-africa, eastern-africa, economics, food-security, indicators, markets, som
数据集内容
- 领域:粮食安全与营养
- 观测单位:国家级汇总数据
- 地理范围:索马里
- 时间范围:自1995年起
- 总行数:91,372
- 总列数:18
- 训练集行数:73,097
- 测试集行数:18,274
变量说明
- 地理变量:
country(索马里)、admin_1(Bay, Lower Juba, Lower Shabelle)、longitude(范围40.9983–50.2305)、latitude(范围-0.3461–11.3546)、price_type(Retail, Wage, Wholesale)等。 - 时间变量:
period_date。 - 结果/测量变量:
value(范围97.0–61481250.0)。 - 标识符/元数据:
fnid(SO0000M004, SO0000M024, SO0000M021)、source_document(Food Security and Nutrition Analysis Unit/Famine Early Warning Systems Network (FSNAU/FEWS NET), Somalia, Price)、product_source(Local, Import)、esa_source、esa_processed。 - 其他变量:
market(Baidoa, Hargeisa, Galkayo)、cpcv2(R01709AB, L02123AB, P23161AT)、product(Cowpeas (Red), Goats (Local Quality), Rice (Parboiled))、unit(kg, ea, L)。
数据模式
| 列名 | 类型 | 空值比例 | 范围/示例值 |
|---|---|---|---|
country |
object | 0.0% | Somalia |
fnid |
object | 0.0% | SO0000M004, SO0000M024, SO0000M021 |
market |
object | 0.0% | Baidoa, Hargeisa, Galkayo |
admin_1 |
object | 0.0% | Bay, Lower Juba, Lower Shabelle |
longitude |
float64 | 0.0% | 40.9983 – 50.2305 (mean 44.6429) |
latitude |
float64 | 0.0% | -0.3461 – 11.3546 (mean 4.8717) |
cpcv2 |
object | 0.0% | R01709AB, L02123AB, P23161AT |
product |
object | 0.0% | Cowpeas (Red), Goats (Local Quality), Rice (Parboiled) |
source_document |
object | 0.0% | Food Security and Nutrition Analysis Unit/Famine Early Warning Systems Network (FSNAU/FEWS NET), Somalia, Price |
period_date |
datetime64[ns] | 0.0% | |
price_type |
object | 0.0% | Retail, Wage, Wholesale |
product_source |
object | 0.0% | Local, Import |
unit |
object | 0.0% | kg, ea, L |
unit_type |
object | 0.0% | |
currency |
object | 0.0% | |
value |
float64 | 11.2% | 97.0 – 61481250.0 (mean 336865.2138) |
esa_source |
object | 0.0% | |
esa_processed |
object | 0.0% |
数值摘要
| 列名 | 最小值 | 最大值 | 平均值 | 中位数 |
|---|---|---|---|---|
longitude |
40.9983 | 50.2305 | 44.6429 | 44.0668 |
latitude |
-0.3461 | 11.3546 | 4.8717 | 3.8 |
value |
97.0 | 61481250.0 | 336865.2138 | 20000.0 |
数据预处理
- 原始数据通过CKAN API从HDX下载并转换为Parquet格式。
- 列名被转换为小写和蛇形命名法。
- 常见的缺失值标记被统一为
NaN。 - 基于解析成功率(>85%阈值),1列从字符串转换为数值或日期时间类型。
- 使用固定随机种子(42)将数据集按80/20比例分割为训练集和测试集,并保存为Snappy压缩的Parquet文件。
使用方式
python from datasets import load_dataset
ds = load_dataset("electricsheepafrica/africa-fewsnet-staple-food-price-data-for-somalia-monthly-133") train = ds["train"].to_pandas() test = ds["test"].to_pandas()
print(train.shape) train.head()
局限性
- 数据来源于FEWS NET,未经ESA独立验证。
- 自动清理无法纠正原始收集中误报的值、定义不一致或抽样偏差。
- 有关发布方的方法说明和注意事项,请参考原始HDX数据集页面:https://data.humdata.org/dataset/fewsnet_staple_food_price_data_for_somalia_monthly_133。
引用格式
bibtex @dataset{hdx_africa_fewsnet_staple_food_price_data_for_somalia_monthly_133, title = {Somalia Monthly FEWS NET Staple Food Price Data}, author = {FEWS NET}, year = {2026}, url = {https://data.humdata.org/dataset/fewsnet_staple_food_price_data_for_somalia_monthly_133}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }
搜集汇总
数据集介绍

构建方式
在粮食安全监测领域,索马里月度主食价格数据集的构建依托于饥荒预警系统网络自1995年以来的系统性收集工作。原始数据通过人道主义数据交换平台的CKAN接口获取,随后经过自动化清洗流程,统一了缺失值标记并转换为蛇形命名规范。为确保机器学习任务的适用性,数据被转换为Parquet格式,并依据解析成功率将字符串列转型为数值或日期类型,最终以固定随机种子划分为训练集与测试集,形成结构化存储。
特点
该数据集以国家层面聚合观测为核心,涵盖索马里多个行政区域与市场的主食价格动态,时间跨度长达数十年。其结构包含18个变量,融合了地理坐标、产品分类、价格类型及货币单位等多维度信息,数值范围从97.0至61481250.0,展现了广泛的经济波动。数据集经过精心整理,缺失率较低,且所有字段均经过标准化处理,为经济预测与粮食安全分析提供了高一致性的时空序列基础。
使用方法
研究人员可通过Hugging Face的datasets库直接加载该数据集,利用Python环境快速导入为Pandas DataFrame以进行探索性分析。数据集已预分为训练与测试两部分,适用于回归建模、价格趋势预测及市场干预效果评估等任务。使用者应结合原始发布方的方法论说明,审慎处理数据中可能存在的报告偏差或定义不一致问题,以确保分析结论的稳健性。
背景与挑战
背景概述
索马里月度FEWS NET主食价格数据集由饥荒早期预警系统网络(FEWS NET)自1995年起持续收集,旨在监测和分析索马里地区的粮食安全状况。该数据集聚焦于主食商品的价格动态,涵盖零售、批发及工资等多种价格类型,为理解东非地区经济波动与民生脆弱性提供了关键实证基础。其创建源于国际人道主义机构对长期粮食危机预警的迫切需求,通过系统化记录市场数据,支持政策制定者与研究人员评估干预措施的有效性,从而在粮食安全与营养领域产生了深远影响。
当前挑战
该数据集致力于解决粮食安全监测中的价格预测与趋势分析问题,其核心挑战在于如何从高度波动的市场数据中提取稳健信号,以应对索马里地区因冲突、气候变迁与经济不稳定导致的极端价格波动。在构建过程中,数据收集面临实地调研的困难,包括在动荡环境中确保数据连续性与准确性,同时原始数据中存在报告不一致、缺失值及定义差异等问题,需通过自动化清洗流程统一处理,但无法完全纠正潜在的采样偏差或误报数值,这限制了模型在复杂现实场景中的泛化能力。
常用场景
经典使用场景
在粮食安全与营养分析领域,索马里月度主食价格数据集为研究者提供了长期、连续的市场价格监测记录。该数据集常被用于构建时间序列模型,以预测未来主食价格走势,从而评估粮食供应的稳定性。通过整合地理与产品类别信息,学者能够深入探究不同区域间价格波动的空间异质性,为早期预警系统提供数据支撑。
解决学术问题
该数据集有效解决了粮食安全研究中价格数据稀缺与碎片化的问题,为量化市场冲击、气候事件对食品价格的影响提供了实证基础。其长期跨度的观测值使得研究者能够识别结构性趋势与周期性波动,从而深化对脆弱经济体价格形成机制的理解,推动粮食安全指标体系的完善。
衍生相关工作
围绕该数据集衍生的经典工作包括基于机器学习的价格预测模型、粮食安全风险地图的构建以及市场整合度分析。这些研究不仅拓展了应用计量经济学在脆弱国家的实践,还促进了多学科交叉,如将气候数据与价格序列耦合,以评估环境变化对粮食系统的连锁效应。
以上内容由遇见数据集搜集并总结生成



