AgMMU (Agricultural Multimodal Understanding and Reasoning Benchmark)

Name: AgMMU (Agricultural Multimodal Understanding and Reasoning Benchmark)
Creator: 伊利诺伊大学厄巴纳-香槟分校、莱斯大学、卡内基梅隆大学
Published: 2025-04-15 01:59:45
License: 暂无描述

arXiv2025-04-15 更新2025-04-19 收录

下载链接：

https://agmmu.github.io/

下载链接

链接失效反馈

官方服务：

资源简介：

AgMMU是一个综合性的农业多模态理解和推理基准数据集，由伊利诺伊大学厄巴纳-香槟分校等机构创建。该数据集包括5460个多选题和开放性问题，所有问题和答案均源自2013至2024年间互联网上用户与农业专家之间的116231次真实对话。数据集涵盖昆虫识别、物种识别、疾病分类、管理指导和症状描述等五种知识类型，旨在评估和开发能够在知识密集型领域（如农业）提供准确事实答案的视觉语言模型。

AgMMU is a comprehensive agricultural multimodal understanding and reasoning benchmark dataset developed by institutions including the University of Illinois Urbana-Champaign and others. This dataset contains 5,460 multiple-choice and open-ended questions, all of which are sourced from 116,231 real-world online dialogues between users and agricultural experts spanning the period from 2013 to 2024. The dataset covers five knowledge categories: insect identification, species identification, disease classification, management guidance, and symptom description. It aims to evaluate and develop vision-language models capable of providing accurate factual answers in knowledge-intensive domains such as agriculture.

提供机构：

伊利诺伊大学厄巴纳-香槟分校、莱斯大学、卡内基梅隆大学

创建时间：

2025-04-15

搜集汇总

数据集介绍

构建方式

AgMMU数据集的构建采用了多阶段精心设计的流程，首先从2013至2024年间116,231组真实用户与农业专家的对话中提取原始数据，通过LLaMA-70B模型进行农业子领域分类和实体识别。随后利用LLaMA-405B模型进行细粒度知识提取，将对话内容分解为物种识别、病虫害诊断等5类核心知识类型。最后通过GPT-4o生成5,460道多选题和开放式问题，并构建包含205,399条专业知识的训练集AGBASE-200K。整个过程采用三阶段人工验证机制，确保数据质量与隐私合规性。

特点

作为首个农业多模态理解基准，AgMMU具有三大核心特征：其知识密集型特性要求模型同时具备精确视觉解析（如病虫害形态识别）与专业领域知识应用能力；数据来源上全部采用真实场景下的用户-专家对话，包含12,481张非摄影级田间图像，真实反映农业实践中的复杂场景；评估体系上创新性地融合多选题和开放式问题，并保持疾病诊断、物种识别等五大知识类别的平衡分布，全面检验模型性能。

使用方法

该数据集支持两种主要应用范式：作为评估基准时，研究者可通过5,460道多选题和开放式问题测试模型在农业专业领域的零样本表现，特别关注模型在结合视觉细节与领域知识方面的能力；作为训练资源时，AGBASE-200K知识库可用于微调视觉语言模型，实验表明能使LLaVA-1.5的准确率提升3.1%。使用需遵循分层评估协议，对开放式问题建议采用LLM-as-judge方法进行分级评分。

背景与挑战

背景概述

AgMMU（农业多模态理解与推理基准）是由伊利诺伊大学厄巴纳-香槟分校的研究团队于2025年创建的一个综合性农业领域多模态数据集。该数据集旨在评估和开发视觉语言模型（VLMs）在知识密集型专家领域（如农业）中生成事实准确答案的能力。AgMMU的核心研究问题是通过结合详细的视觉观察和精确的农业知识，解决诸如害虫识别、管理指导等农业诊断任务。数据集基于2013年至2024年间116,231条真实用户与农业专家的对话构建，涵盖了五种知识类型：症状描述、昆虫识别、物种识别、管理指导和疾病分类。AgMMU的独特之处在于其所有事实、问题和答案均来自真实世界的专家对话，经过三步数据筛选流程（GPT-4o、LLaMA模型和人工验证）确保高质量。该数据集对农业领域的AI应用具有重要影响力，尤其是在提升作物诊断准确性和农业决策支持方面。

当前挑战

AgMMU面临的挑战主要包括两个方面：领域问题的挑战和构建过程中的挑战。在领域问题方面，农业诊断任务需要模型具备精确的视觉分析能力（如识别特定疾病或害虫）和广泛的领域知识（如治疗方案和生长条件），而现有视觉语言模型在结合详细感知和事实知识方面表现不佳。构建过程中的挑战包括：1) 农业专家标注数据的稀缺性和专业性，导致高质量数据集的构建困难；2) 真实农业问题的多模态特性，要求同时处理视觉和文本信息；3) 缺乏明确的协议来定义具有代表性的农业问题分布，使得数据集的平衡性和覆盖范围难以保证。此外，数据集中图像的质量和多样性（如分辨率、光照条件）也增加了模型训练的难度。

常用场景

经典使用场景

AgMMU数据集在农业多模态理解和推理领域具有广泛的应用场景。该数据集通过结合视觉和文本信息，为研究人员提供了一个全面的基准测试平台，用于评估和开发视觉语言模型（VLMs）在农业领域的表现。其经典使用场景包括病虫害识别、植物物种分类、疾病诊断以及管理建议生成等任务。这些任务要求模型不仅能够准确理解图像中的细节，还需要具备丰富的农业领域知识。

实际应用

在实际应用中，AgMMU数据集可以支持农业专家系统和智能助手的开发。例如，农民和园艺爱好者可以通过基于该数据集训练的模型，快速识别作物疾病或害虫，并获得相应的管理建议。此外，该数据集还可用于开发农业知识问答系统，帮助用户解决日常种植和管理中的问题。这些应用不仅提高了农业生产的效率，还有助于减少作物损失，提升食品安全。

衍生相关工作

AgMMU数据集已经衍生出多项相关研究和工作。例如，基于该数据集的微调实验显著提升了LLaVA-1.5模型在农业任务上的性能。此外，该数据集还启发了更多关于知识密集型VLMs的研究，特别是在如何将领域专业知识整合到通用模型中的探索。未来，AgMMU有望推动更多针对农业领域的多模态模型开发和评估工作。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集