five

africa-faostat-food-prices-for-somalia

收藏
Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-faostat-food-prices-for-somalia
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为“索马里 - 食品价格”,由联合国粮食及农业组织(FAO)发布,来源于人道主义数据交换平台(HDX)。数据集包含索马里的食品价格数据,涵盖消费者价格指数、平减指数和汇率等类别。数据以国家层面的汇总形式呈现,每条记录代表一个时间点的汇总数据。数据集共包含438条记录,分为350条训练数据和87条测试数据。数据包含17个字段,包括6个数值型、9个类别型和2个日期时间型字段。地理范围限定为索马里(SOM),时间覆盖范围为1970年至2024年。数据集经过Electric Sheep Africa整理,转换为适合机器学习的Parquet格式。适用于食品安全和营养领域的表格回归任务。
创建时间:
2026-04-09
原始信息汇总

数据集概述:Somalia - Food Prices

基本描述

  • 数据集名称:Somalia - Food Prices
  • 发布者:联合国粮食及农业组织 (FAO)
  • 数据来源:HDX (https://data.humdata.org/dataset/faostat-food-prices-for-somalia)
  • 许可证:cc-by-igo
  • 更新日期:2026-04-06
  • 领域:粮食安全与营养
  • 观测单位:国家级汇总数据
  • 地理范围:索马里 (SOM)
  • 语言:英语
  • 多语言性:单语
  • 规模类别:n<1K
  • 任务类别:表格回归
  • 标签:africa, humanitarian, hdx, electric-sheep-africa, food-security, indicators, som

数据集构成

  • 总行数:438
  • 总列数:17 (6个数值型,9个类别型,2个日期时间型)
  • 训练集:350行
  • 测试集:87行

数据内容

  • 时间覆盖范围startdateenddate 列指示,yearyear_code 范围为1970.0至2024.0。
  • 数据类别:包含消费者价格指数、平减指数、汇率数据,源自FAOSTAT批量数据服务。
  • 关键变量
    • 地理iso3 (SOM)
    • 结果/测量value (范围0.0049–199.9149)
    • 标识符/元数据area_code, area_code_m49, item_code, element_code, esa_source
    • 其他area (Somalia), item, element, unit, flag

数据模式与摘要

  • 所有列均无空值 (Null % 均为 0.0%)。
  • 数值列摘要
    • area_code: 201.0 – 201.0
    • item_code: 22024.0 – 22028.0
    • element_code: 6179.0 – 62250.0
    • year_codeyear: 1970.0 – 2024.0
    • value: 0.0049 – 199.9149

数据处理

  • 处理方:Electric Sheep Africa (https://huggingface.co/electricsheepafrica)
  • 处理日期esa_processed 列为 2026-04-09
  • 处理流程:原始数据从HDX通过CKAN API下载并转换为Parquet格式;列名标准化为蛇形命名法;统一缺失值标记为NaN;基于解析成功率(>85%阈值)将2列从字符串转换为数值或日期时间类型;使用固定随机种子(42)按80/20比例拆分为训练集和测试集,并保存为Snappy压缩的Parquet文件。

使用方式

python from datasets import load_dataset ds = load_dataset("electricsheepafrica/africa-faostat-food-prices-for-somalia")

局限性

  • 数据源自联合国粮农组织,未经ESA独立验证。
  • 自动清洗无法纠正原始收集中误报的值、定义不一致或抽样偏差。
  • 有关发布者自身的方法说明和注意事项,请参考原始HDX数据集页面 (https://data.humdata.org/dataset/faostat-food-prices-for-somalia)。

引用

bibtex @dataset{hdx_africa_faostat_food_prices_for_somalia, title = {Somalia - Food Prices}, author = {Food and Agriculture Organization (FAO) of the United Nations}, year = {2026}, url = {https://data.humdata.org/dataset/faostat-food-prices-for-somalia}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }

搜集汇总
数据集介绍
main_image_url
构建方式
在粮食安全与营养监测领域,索马里食品价格数据集源于联合国粮农组织(FAO)的FAOSTAT批量数据服务,原始数据通过人道主义数据交换平台(HDX)发布。Electric Sheep Africa团队运用自动化流程,经由CKAN API获取原始资料,并执行系统化数据清洗与标准化操作。具体步骤包括统一缺失值标记为NaN、将符合解析阈值的字段转换为数值或日期时间类型,并将列名规范为蛇形命名法。最终,数据以Snappy压缩的Parquet格式保存,并按照固定随机种子划分为训练集与测试集,确保其可直接应用于机器学习任务。
特点
该数据集聚焦于索马里国家层面的聚合指标,涵盖1970年至2024年的长时间序列,包含消费者价格指数、平减指数及汇率等多类经济指标。数据集共438条观测记录,具备17个特征变量,其中6个为数值型、9个为分类型、2个为日期时间型,结构清晰且字段完整。所有数据均经过严格清洗,缺失值统一处理,确保了数据质量与一致性。其以国家为观测单元的特点,使得研究者能够宏观分析索马里的食品价格与经济波动趋势,为区域经济政策与粮食安全研究提供了可靠的数据基础。
使用方法
研究者可通过Hugging Face的datasets库直接加载该数据集,利用Python环境快速导入训练集与测试集,并转换为Pandas DataFrame以进行后续分析。数据集适用于表格回归任务,可用于构建价格预测模型或经济指标关联性分析。在使用过程中,建议参考原始HDX页面中的方法论说明与注意事项,以充分理解数据背景与潜在局限。该数据集已预先分割为训练集(350行)与测试集(87行),支持开箱即用的机器学习流程,助力于粮食安全与宏观经济领域的实证研究。
背景与挑战
背景概述
在粮食安全与营养监测领域,索马里食品价格数据集由联合国粮食及农业组织(FAO)发布,并由Electric Sheep Africa机构于2026年重新整理为机器学习可用格式。该数据集聚焦于索马里国家层面的食品价格指数、通货紧缩因子及汇率等宏观经济指标,时间跨度涵盖1970年至2024年。其核心研究问题在于通过长期时序数据揭示索马里食品市场的价格波动规律,为粮食安全政策制定、经济稳定性分析及人道主义干预提供数据支撑。该数据集作为非洲区域经济监测的重要资源,为研究人员和政策制定者提供了量化分析的基础,推动了数据驱动决策在脆弱国家情境下的应用。
当前挑战
该数据集旨在解决食品价格预测与粮食安全风险评估的领域挑战,具体涉及在数据稀疏且不稳定的冲突后国家中,如何准确建模价格时序趋势并识别异常波动。构建过程中的挑战主要包括原始数据可能存在报告不一致、定义差异及采样偏差,自动化清洗流程难以纠正这些系统性误差;同时,数据集规模较小(仅438条记录),且覆盖指标有限,可能限制复杂机器学习模型的泛化能力。此外,数据来源于国际组织的聚合统计,缺乏地方层面的细粒度验证,这为模型的可解释性与实际应用带来了不确定性。
常用场景
经典使用场景
在粮食安全与宏观经济研究领域,该数据集为索马里提供了长期且标准化的价格指数序列,涵盖GDP平减指数、资本形成平减指数及农业增加值平减指数等关键指标。研究者通常利用这些时间序列数据,构建计量经济模型以分析通货膨胀动态、实际经济增长趋势以及部门间价格变动的传导机制。数据集的时间跨度从1970年至2024年,为捕捉长期经济波动与结构性变化提供了坚实基础,尤其适用于检验价格稳定性假说或评估外部冲击对国内经济的影响。
衍生相关工作
围绕该数据集衍生的学术工作,主要集中在利用时间序列分析与面板数据方法探索非洲之角的经济韧性。经典研究包括构建索马里特定部门的通货膨胀预测模型,以及将平减指数与气候、冲突数据融合,以量化外部冲击对粮食安全与生计的影响。此外,学者们常将此数据集与FAO的其他区域数据结合,进行跨国比较研究,分析不同政策框架下价格稳定机制的成效。这些工作深化了对脆弱国家经济动态的理解,并推动了针对人道主义背景的定制化计量工具的发展。
数据集最近研究
最新研究方向
在粮食安全与宏观经济监测领域,索马里食品价格数据集为研究脆弱地区的经济韧性提供了关键时序数据。当前前沿探索聚焦于利用机器学习模型预测食品价格波动,结合气候异常与地缘政治事件,分析其对当地通胀与民生稳定的连锁影响。这类研究不仅助力人道主义组织优化援助策略,也为构建早期预警系统提供了实证基础,推动数据驱动决策在非洲发展议题中的应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作