AgroMind
收藏arXiv2025-05-18 更新2025-05-21 收录
下载链接:
https://rssysu.github.io/AgroMind/
下载链接
链接失效反馈官方服务:
资源简介:
AgroMind是一个涵盖农业遥感场景的综合性数据集,包含8个公共数据集和1个私有农田地块数据集,共包含15,556张图像和25,026个问答对。该数据集支持多种关键农业应用,如害虫和疾病监测、地块分析、多种作物识别以及农业场景中的异常检测。AgroMind包含13个任务类型,涵盖空间感知、对象理解、场景理解和场景推理四个核心维度,旨在为农业领域的大型多模态模型提供一个全面的评估框架。该数据集通过集成多源数据并生成多样化的农业相关问题,为模型推理和详细分析提供了支持。
AgroMind is a comprehensive dataset covering agricultural remote sensing scenarios. It integrates 8 public datasets and 1 private farmland plot dataset, with a total of 15,556 images and 25,026 question-answer pairs. This dataset supports a variety of key agricultural applications, including pest and disease monitoring, plot analysis, crop species identification, and anomaly detection in agricultural scenarios. AgroMind includes 13 task types, covering four core dimensions: spatial perception, object understanding, scene understanding, and scene reasoning, aiming to provide a comprehensive evaluation framework for large multimodal models in the agricultural domain. This dataset supports model reasoning and in-depth analysis by integrating multi-source data and generating diverse agriculture-related questions.
提供机构:
中山大学, 清华大学, 中国农业大学, 西南交通大学, 深圳国家超级计算中心
创建时间:
2025-05-18
搜集汇总
数据集介绍

构建方式
AgroMind数据集通过整合八个公开数据集和一个私有农田地块数据集构建而成,涵盖农业遥感中的多场景、多任务评估。数据预处理包括多源数据格式标准化、标注精炼及问题生成,通过定义13种任务类型生成25,026个问答对,覆盖作物识别、健康监测到环境分析等多个农业应用场景。
特点
AgroMind数据集以其广泛的场景多样性和任务复杂性著称,包含15,556张图像和25,026个问答对,涵盖四种核心任务维度:空间感知、对象理解、场景理解和场景推理。数据集特别强调农业领域的特殊性,如病虫害诊断和农田边界检测,同时支持多种传感器数据(卫星、无人机和地面相机)的融合评估。
使用方法
AgroMind数据集适用于评估大型多模态模型在农业遥感任务中的性能。使用方法包括加载标准化图像和问答对,通过预定义的评估协议(如严格字符串匹配或语义相似度计算)对模型输出进行评分。用户可根据任务维度(如空间定位或异常推理)筛选数据,并参考提供的基准结果进行模型对比分析。
背景与挑战
背景概述
AgroMind是由清华大学、中山大学等机构的研究团队于2025年提出的农业遥感多模态基准测试数据集,旨在系统评估大型多模态模型(LMMs)在农业场景中的理解能力。该数据集整合了8个公开数据集和1个私有农田地块数据,包含15,556张图像和25,026个问答对,覆盖作物识别、健康监测、病虫害诊断等13类农业任务。其创新性体现在构建了空间感知、对象理解、场景理解和场景推理的四维评估体系,突破了传统农业基准在场景多样性和任务复杂性方面的局限,为农业智能化转型提供了标准化评估工具。
当前挑战
AgroMind面临的核心挑战体现在两个方面:领域问题层面,需解决农业遥感中跨模态数据融合、细粒度目标识别和复杂场景推理等难题,现有模型在空间关系判断(如作物分布分析)和生长状态识别(如病虫害程度评估)任务上平均准确率低于35%;数据构建层面,需处理多源异构数据(卫星、无人机、地面传感器)的标准化问题,包括不同分辨率图像的标注对齐(如300×300至4,500×4500像素)、多任务问答对生成(如将病虫害VOC标注转化为诊断型问答),以及气候条件、作物类型等场景多样性的平衡。
常用场景
经典使用场景
在农业遥感领域,AgroMind数据集通过整合多源异构数据(包括卫星、无人机和地面传感器图像),为大型多模态模型(LMMs)提供了全面的评估基准。其经典使用场景包括作物健康监测、病虫害诊断、农田边界识别以及多尺度环境分析。该数据集特别适用于验证模型在复杂农业场景中的空间感知、对象理解和场景推理能力,例如通过高分辨率图像识别玉米雄穗分布或通过多光谱数据检测农田异常区域。
实际应用
在实际应用中,AgroMind支持精准农业的多个关键环节:无人机影像可用于油棕树生长状态实时监测,帮助农场主优化收割计划;卫星多光谱数据结合边界检测任务能自动计算农田覆盖率,辅助土地资源管理;病虫害诊断模块可集成到移动端应用,为农民提供实时作物健康评估。其多模态特性尤其适用于发展中国家的小农户场景,通过低成本摄像头采集图像即可获得专业级的农业分析。
衍生相关工作
基于AgroMind的评估框架,已衍生出多个重要研究方向:InternVL2-26B等开源模型通过在该基准上的迭代优化,显著提升了农业场景的细粒度识别能力;后续研究如Agri-LLaVA将视觉提示推理任务扩展至作物产量预测领域;同时,该数据集启发了跨模态融合的新方法,如将SAR影像与光学数据联合分析的AgroFusionNet。这些工作共同推动了农业人工智能从单一分类向复杂决策支持的范式转变。
以上内容由遇见数据集搜集并总结生成



