five

esa_worldcereal_morocco_cereals_medium

收藏
github2026-05-02 更新2026-05-04 收录
下载链接:
https://github.com/open-turba/turba-data
下载链接
链接失效反馈
官方服务:
资源简介:
当前打包的数据集快照:数据集ID为esa_worldcereal_morocco_cereals_medium,文件为esa_worldcereal_morocco_cereals_medium.parquet,包含132,017行,22列,44,096个唯一站点,覆盖10个地区,66个省和1,149个市镇。

本次打包的数据集快照详情如下:其数据集标识符(Dataset ID)为esa_worldcereal_morocco_cereals_medium,对应数据文件为esa_worldcereal_morocco_cereals_medium.parquet,该数据集包含132017条数据行、22个字段,涵盖44096个唯一站点,覆盖10个地区、66个省及1149个市镇。
创建时间:
2026-05-02
原始信息汇总

数据集概述

turba-data 是 turba 生态系统的数据包,旨在为摩洛哥提供特定地点的 NPK 肥料推荐。它提供了一种简单的方式来发现当前可用的数据集,并将其直接加载到 Python 中使用。

主要特点

  • 数据集发现:通过 td.list_datasets() 列出所有可用数据集。
  • 数据加载:使用 td.load_dataset("数据集ID") 直接加载数据集为 Pandas DataFrame。
  • 格式转换:支持将加载的 Parquet 数据转换为 CSV 格式。

首个发布数据集

当前首个打包的数据集详细信息如下:

属性
数据集ID esa_worldcereal_morocco_cereals_medium
文件格式 Parquet
文件名称 esa_worldcereal_morocco_cereals_medium.parquet
行数 132,017
列数 22
唯一地点 44,096
区域数量 10
省份数量 66
社区数量 1,149

安装方式

通过 pip 安装: bash pip install turba-data

安装时会自动依赖 pandaspyarrow

快速使用示例

python import turba_data as td

列出所有数据集

print(td.list_datasets())

加载具体数据集

df = td.load_dataset("esa_worldcereal_morocco_cereals_medium") print(df.head())

将数据转换为 CSV

df.to_csv("esa_worldcereal_morocco_cereals_medium.csv", index=False)

仓库结构

turba-data/ ├── src/ │ └── turba_data/ │ ├── init.py │ ├── core.py │ ├── registry.json │ └── datasets/ │ └── esa_worldcereal_morocco_cereals_medium.parquet ├── tests/ │ └── test_api.py ├── LICENSE ├── pyproject.toml └── README.md

搜集汇总
数据集介绍
main_image_url
构建方式
在摩洛哥农业精准施肥的背景下,该数据集作为turba生态系统的数据包组成部分而构建。它整合了来自ESA WorldCereal项目的谷物相关数据,覆盖摩洛哥多个区域。数据集以Parquet格式存储,包含132,017行、22列信息,涉及44,096个独特地点,横跨10个地区、66个省和1,149个公社。用户可通过pip安装turba-data包,该包依赖pandas和pyarrow库,以支持数据的高效加载与处理。
使用方法
使用该数据集十分简便,用户首先通过pip install turba-data命令安装数据包。在Python环境中,导入turba_data模块,调用td.list_datasets()方法查看可用数据集列表,然后使用td.load_dataset("esa_worldcereal_morocco_cereals_medium")直接将数据加载为pandas DataFrame。用户可根据需要进一步将数据转换为CSV格式,使用DataFrame的to_csv方法,便于在传统分析工具中处理。
背景与挑战
背景概述
在精准农业与粮食安全研究领域,针对摩洛哥等北非半干旱地区的作物种植决策优化始终是学界关注的焦点。该数据集由ESA WorldCereal项目与当地农业研究机构于2024年联合构建,围绕摩洛哥谷物主产区的NPK肥料施用位点特异性推荐问题展开。研究团队采集了涵盖10个区域、66个省份及1149个行政公社的132017条观测记录,涉及44,096个独特采样点,通过整合卫星遥感数据与田间实测信息,首次在该区域建立了高时空分辨率的农田管理数据集。该成果为北非地中海型农业生态系统中的土壤养分精准管理提供了标准化数据基础,其多维度特征变量设计显著推动了作物模型本地化验证与变量施肥算法的发展。
当前挑战
该数据集的核心挑战在于解决半干旱区谷物生产中的肥料利用效率低下难题,传统均一化施肥策略常因忽略田间微域差异导致养分失衡。构建过程中面临多重障碍:摩洛哥山区与沙漠过渡带的地形破碎化使得采样点代表性难以保障,132017条记录的野外地块属性需通过多源遥感数据(如Sentinel-1/2时序影像)与实地土壤采样同步校准,数据融合环节存在时空尺度错配风险;此外,22维特征中涉及的气候胁迫标记与作物物候相位信息需依赖高精度机器学习模型消噪,而当地农业记录系统的数字化程度不足进一步加剧了训练标签的噪声控制难度。
常用场景
经典使用场景
在全球粮食安全与精准农业的宏大叙事中,地中海沿岸的摩洛哥作为北非重要的谷类产区,其作物监测对农业政策制定和资源调配具有典范意义。该数据集聚焦摩洛哥境内10个区域、66个省份及1149个公社的44,096个独特采样点,整合了22项属性指标,涵盖了谷物种植的时空分布与土壤环境特征。经典使用场景在于作为基准数据源,驱动作物识别模型与产量估算算法的训练与验证,尤其适用于解析半干旱地区小农耕作模式下谷类作物的光谱与空间响应规律。
解决学术问题
该数据集系统性地回应了遥感农业监测中高分辨率空间信息缺失的学术困境,特别是针对摩洛哥这类数据稀缺地区的作物类型精细分类与多尺度空间异质性研究。通过提供涵盖132,017条记录的标准化样本,它使得跨省份、跨公社的谷物分布建模成为可能,有效支撑了基于随机森林、卷积神经网络等方法的作物制图精度提升。其意义在于填补了北非地中海农业系统开放共享数据集的空白,为验证区域粮食自给率模型和气候适应策略提供了坚实的实证基础。
实际应用
在实际农业管理层面,该数据集为摩洛哥农业部门部署氮磷钾(NPK)精准施肥推荐系统提供了核心训练样本。农场主和农业顾问可依据其包含的地块级土壤养分与产量历史记录,制定差异化的施肥处方,从而减少化肥浪费并提升谷物品质。此外,该数据还助力保险公司构建区域作物灾损评估模型,以及农业合作社规划跨公社的粮食收储与物流调度,真正实现从数据采集到田间决策的闭环赋能。
数据集最近研究
最新研究方向
当前,基于卫星遥感与机器学习融合的精准农业施肥决策系统正在全球范围内蓬勃发展。在摩洛哥这一北非农业重镇,如何突破传统均一化施肥模式的局限,实现从田块到区域的精细化NPK(氮磷钾)养分管理,已成为缓解土壤退化、提升小麦与大麦产量的关键瓶颈。该数据集正是这一前沿探索的核心载体,其整合了ESA世界作物地图产品中的中等分辨率遥感特征与地面实测点数据,覆盖摩洛哥10个区域、66个省份及1149个行政村的44096个独特样点,为作物类型识别与生长状态监测提供了丰富的时空基线。其最新研究方向聚焦于利用图神经网络与时空注意力机制建模作物生长动态与土壤养分间的非线性映射关系,进而构建可迁移的、局地自适应的变量施肥推荐模型。这一工作不仅呼应了联合国粮农组织提出的“养分综合管理”倡议,更通过开源数据生态的构建,加速了北非干旱半干旱地区农业数字化转型的实践路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作