five

africa-faostat-food-prices-for-sao-tome-and-principe

收藏
Hugging Face2026-04-15 更新2026-04-16 收录
下载链接:
https://huggingface.co/datasets/electricsheepafrica/africa-faostat-food-prices-for-sao-tome-and-principe
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为“圣多美和普林西比 - 食品价格”,由联合国粮食及农业组织(FAO)发布,并通过HDX平台提供。数据集包含圣多美和普林西比的国家级食品价格和相关指标数据,涵盖消费者价格指数、平减指数和汇率等类别。数据集经过Electric Sheep Africa整理,转换为适合机器学习的Parquet格式。数据集总共有438行,分为350行的训练集和87行的测试集。包含17个字段,其中6个为数值型,9个为分类变量,2个为日期时间类型。字段包括地理信息(如iso3、year_code)、时间信息(startdate、enddate)、测量值(value)以及元数据标识符(如area_code、item_code等)。数据集适用于表格回归任务,主要用于食品安全和营养领域的研究。
创建时间:
2026-04-08
原始信息汇总

数据集概述:圣多美和普林西比 - 食品价格

基本描述

  • 数据集名称:Sao Tome and Principe - Food Prices
  • 数据集标识electricsheepafrica/africa-faostat-food-prices-for-sao-tome-and-principe
  • 发布机构:联合国粮食及农业组织 (FAO)
  • 数据来源:人道主义数据交换平台 (HDX) (https://data.humdata.org/dataset/faostat-food-prices-for-sao-tome-and-principe)
  • 数据提供方:Electric Sheep Africa (https://huggingface.co/electricsheepafrica)
  • 许可协议cc-by-igo
  • 最后更新日期:2026-04-06 (HDX);2026-04-08 (处理日期)
  • 语言:英语
  • 领域:粮食安全和营养
  • 任务类别:表格回归

数据集内容

  • 数据摘要:包含圣多美和普林西比的食品价格数据,涵盖消费者价格指数、平减指数、汇率等类别。每一行代表国家层面的聚合数据。
  • 地理范围:圣多美和普林西比 (STP)
  • 时间范围:1970年至2024年
  • 观测单位:国家层面聚合数据
  • 数据总量:438行
  • 特征列数:17列 (6个数值型,9个类别型,2个日期时间型)
  • 数据分割
    • 训练集:350行
    • 测试集:87行

数据特征与变量

主要变量

  • 地理变量iso3 (STP), year_code (1970.0–2024.0), year (1970.0–2024.0)
  • 时间变量startdate, enddate
  • 结果/测量变量value (0.0511–284.9006)
  • 标识/元数据变量area_code (193.0–193.0), area_code_m49 (678), item_code (22024.0–22028.0), element_code (6179.0–62250.0), esa_source (HDX) 等
  • 其他变量area (Sao Tome and Principe), item (GDP平减指数、固定资本形成总额平减指数、增加值平减指数等), element (标准本地货币价值、美元价值等), unit (SLC, USD), flag (X, E)

数值摘要

列名 最小值 最大值 平均值 中位数
area_code 193.0 193.0 193.0 193.0
item_code 22024.0 22028.0 22025.7397 22025.0
element_code 6179.0 62250.0 34214.5 34214.5
year_code 1970.0 2024.0 1996.8767 1997.0
year 1970.0 2024.0 1996.8767 1997.0
value 0.0511 284.9006 62.8565 56.2405

数据处理与格式

  • 原始数据源:FAOSTAT批量数据服务 (https://fenixservices.fao.org/faostat/static/bulkdownloads/datasets_E.json)
  • 处理流程:从HDX通过CKAN API下载原始数据,转换为Parquet格式。列名转为小写蛇形命名,统一缺失值标记为NaN,基于解析成功率将2列从字符串转换为数值或日期时间类型。
  • 数据格式:经过Snappy压缩的Parquet格式
  • 数据分割:使用固定随机种子 (42) 按80/20比例划分为训练集和测试集

使用方式

python from datasets import load_dataset

ds = load_dataset("electricsheepafrica/africa-faostat-food-prices-for-sao-tome-and-principe") train = ds["train"].to_pandas() test = ds["test"].to_pandas()

局限性说明

  • 数据来源于联合国粮食及农业组织,未经Electric Sheep Africa独立验证。
  • 自动清洗无法纠正原始数据中误报的值、定义不一致或抽样偏差。
  • 建议参考原始HDX数据集页面 (https://data.humdata.org/dataset/faostat-food-prices-for-sao-tome-and-principe) 获取发布方的方法说明和注意事项。

引用格式

bibtex @dataset{hdx_africa_faostat_food_prices_for_sao_tome_and_principe, title = {Sao Tome and Principe - Food Prices}, author = {Food and Agriculture Organization (FAO) of the United Nations}, year = {2026}, url = {https://data.humdata.org/dataset/faostat-food-prices-for-sao-tome-and-principe}, note = {Repackaged for machine learning by Electric Sheep Africa (https://huggingface.co/electricsheepafrica)} }

搜集汇总
数据集介绍
main_image_url
构建方式
在粮食安全与营养监测领域,圣多美和普林西比食品价格数据集源自联合国粮农组织(FAO)的FAOSTAT批量数据服务,通过人道主义数据交换(HDX)平台公开发布。原始数据经由Electric Sheep Africa团队进行系统化整理,利用CKAN API获取数据后,执行了列名标准化、缺失值统一处理以及数据类型转换等清洗步骤。基于85%以上的解析成功率,将字符串列转换为数值或日期时间类型,最终以Snappy压缩的Parquet格式存储,并按照80:20的比例使用固定随机种子划分为训练集与测试集,确保了数据在机器学习任务中的直接可用性。
特点
该数据集聚焦于国家层面的聚合统计,涵盖1970年至2024年长达半个多世纪的时间跨度,提供了消费者价格指数、平减指数及汇率等多类经济指标。数据集包含438条观测记录,涵盖17个特征变量,其中6个为数值型,9个为分类变量,并包含2个日期时间字段。所有数据均围绕圣多美和普林西比(ISO3代码STP)这一单一地理范围,具有高度的时空一致性。数值型变量如`value`的取值范围在0.0511至284.9006之间,反映了不同经济指标的实际量级,为时间序列分析与回归建模提供了结构清晰、覆盖全面的基础。
使用方法
该数据集适用于表格回归任务,尤其适合用于粮食安全指标预测、经济时间序列分析等机器学习应用。用户可通过Hugging Face的`datasets`库直接加载,利用`load_dataset`函数获取已分割的训练集与测试集。数据以Pandas DataFrame格式呈现,便于进行特征工程、可视化及模型训练。研究者可重点关注`value`字段作为预测目标,结合`year`、`item`、`element`等时空与分类变量构建模型。需要注意的是,数据来源于粮农组织的官方统计,使用时应参考其原始方法论说明,并留意自动化清洗过程可能未修正的固有偏差。
背景与挑战
背景概述
在粮食安全与营养监测领域,圣多美和普林西比食品价格数据集由联合国粮食及农业组织于2026年发布,并由Electric Sheep Africa机构重新整理为机器学习可用格式。该数据集聚焦于这一非洲岛国的宏观经济指标,涵盖1970年至2024年间以平减指数为核心的食品价格相关数据。其核心研究问题在于通过长期时序数据揭示该国食品价格波动与宏观经济稳定性之间的内在关联,为区域粮食安全政策制定与经济学研究提供了关键的数据支撑。
当前挑战
该数据集旨在解决食品价格时序预测与宏观经济指标回归分析中的挑战,具体包括如何从有限的国家级聚合数据中捕捉细微的经济波动信号,以及如何处理跨长达半个世纪的数据中可能存在的定义不一致性与报告偏差。在构建过程中,挑战主要源于原始数据源的标准化程度不足,例如不同时期统计口径的变化与缺失值标记的多样性,这要求数据清洗过程必须兼顾自动化效率与对历史统计方法的深入理解,以确保后续机器学习模型的输入质量。
常用场景
经典使用场景
在粮食安全与宏观经济分析领域,该数据集为圣多美和普林西比提供了长期的价格指数与平减指数序列,涵盖GDP平减指数、固定资本形成总额平减指数及农业增加值平减指数等关键指标。研究者通常利用这些时间序列数据构建回归模型,以分析通货膨胀动态、评估货币购买力变化,并探究外部经济冲击对国内价格水平的传导机制。数据集的结构化格式与明确的时间跨度,使其成为检验经济理论、进行预测建模的经典素材。
衍生相关工作
围绕该数据集衍生的经典研究工作,多集中于构建计量经济模型以分析非洲小岛屿经济体的价格形成机制。例如,学者利用其时间序列特征开发了向量自回归模型,用以检验进口依赖型经济中汇率传递效应。另有研究将其与气候或贸易数据融合,评估外部冲击对国内食品价格的非线性影响。这些成果不仅深化了对圣多美和普林西比经济动态的理解,也为更广泛的脆弱国家价格稳定性研究提供了可借鉴的方法论框架。
数据集最近研究
最新研究方向
在粮食安全与宏观经济分析领域,圣多美和普林西比食品价格数据集正成为前沿研究的焦点。该数据集涵盖1970年至2024年的国家层面价格指数与平减指数,为探究小岛屿发展中国家在全球化与气候变迁背景下的经济韧性提供了关键时序数据。当前研究热点集中于利用机器学习模型预测食品价格波动对当地民生与贫困率的影响,并结合联合国可持续发展目标评估政策干预效果。这些分析不仅助力人道主义组织优化资源分配,也为区域经济稳定性研究提供了实证基础,凸显了数据驱动决策在应对全球粮食危机中的战略价值。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务