five

AgMMU (Agricultural Multimodal Understanding and Reasoning Benchmark)

收藏
arXiv2025-04-15 更新2025-04-19 收录
下载链接:
https://agmmu.github.io/
下载链接
链接失效反馈
官方服务:
资源简介:
AgMMU是一个综合性的农业多模态理解和推理基准数据集,由伊利诺伊大学厄巴纳-香槟分校等机构创建。该数据集包括5460个多选题和开放性问题,所有问题和答案均源自2013至2024年间互联网上用户与农业专家之间的116231次真实对话。数据集涵盖昆虫识别、物种识别、疾病分类、管理指导和症状描述等五种知识类型,旨在评估和开发能够在知识密集型领域(如农业)提供准确事实答案的视觉语言模型。

AgMMU is a comprehensive agricultural multimodal understanding and reasoning benchmark dataset developed by institutions including the University of Illinois Urbana-Champaign and others. This dataset contains 5,460 multiple-choice and open-ended questions, all of which are sourced from 116,231 real-world online dialogues between users and agricultural experts spanning the period from 2013 to 2024. The dataset covers five knowledge categories: insect identification, species identification, disease classification, management guidance, and symptom description. It aims to evaluate and develop vision-language models capable of providing accurate factual answers in knowledge-intensive domains such as agriculture.
提供机构:
伊利诺伊大学厄巴纳-香槟分校、莱斯大学、卡内基梅隆大学
创建时间:
2025-04-15
搜集汇总
数据集介绍
main_image_url
构建方式
AgMMU数据集的构建采用了多阶段精心设计的流程,首先从2013至2024年间116,231组真实用户与农业专家的对话中提取原始数据,通过LLaMA-70B模型进行农业子领域分类和实体识别。随后利用LLaMA-405B模型进行细粒度知识提取,将对话内容分解为物种识别、病虫害诊断等5类核心知识类型。最后通过GPT-4o生成5,460道多选题和开放式问题,并构建包含205,399条专业知识的训练集AGBASE-200K。整个过程采用三阶段人工验证机制,确保数据质量与隐私合规性。
特点
作为首个农业多模态理解基准,AgMMU具有三大核心特征:其知识密集型特性要求模型同时具备精确视觉解析(如病虫害形态识别)与专业领域知识应用能力;数据来源上全部采用真实场景下的用户-专家对话,包含12,481张非摄影级田间图像,真实反映农业实践中的复杂场景;评估体系上创新性地融合多选题和开放式问题,并保持疾病诊断、物种识别等五大知识类别的平衡分布,全面检验模型性能。
使用方法
该数据集支持两种主要应用范式:作为评估基准时,研究者可通过5,460道多选题和开放式问题测试模型在农业专业领域的零样本表现,特别关注模型在结合视觉细节与领域知识方面的能力;作为训练资源时,AGBASE-200K知识库可用于微调视觉语言模型,实验表明能使LLaVA-1.5的准确率提升3.1%。使用需遵循分层评估协议,对开放式问题建议采用LLM-as-judge方法进行分级评分。
背景与挑战
背景概述
AgMMU(农业多模态理解与推理基准)是由伊利诺伊大学厄巴纳-香槟分校的研究团队于2025年创建的一个综合性农业领域多模态数据集。该数据集旨在评估和开发视觉语言模型(VLMs)在知识密集型专家领域(如农业)中生成事实准确答案的能力。AgMMU的核心研究问题是通过结合详细的视觉观察和精确的农业知识,解决诸如害虫识别、管理指导等农业诊断任务。数据集基于2013年至2024年间116,231条真实用户与农业专家的对话构建,涵盖了五种知识类型:症状描述、昆虫识别、物种识别、管理指导和疾病分类。AgMMU的独特之处在于其所有事实、问题和答案均来自真实世界的专家对话,经过三步数据筛选流程(GPT-4o、LLaMA模型和人工验证)确保高质量。该数据集对农业领域的AI应用具有重要影响力,尤其是在提升作物诊断准确性和农业决策支持方面。
当前挑战
AgMMU面临的挑战主要包括两个方面:领域问题的挑战和构建过程中的挑战。在领域问题方面,农业诊断任务需要模型具备精确的视觉分析能力(如识别特定疾病或害虫)和广泛的领域知识(如治疗方案和生长条件),而现有视觉语言模型在结合详细感知和事实知识方面表现不佳。构建过程中的挑战包括:1) 农业专家标注数据的稀缺性和专业性,导致高质量数据集的构建困难;2) 真实农业问题的多模态特性,要求同时处理视觉和文本信息;3) 缺乏明确的协议来定义具有代表性的农业问题分布,使得数据集的平衡性和覆盖范围难以保证。此外,数据集中图像的质量和多样性(如分辨率、光照条件)也增加了模型训练的难度。
常用场景
经典使用场景
AgMMU数据集在农业多模态理解和推理领域具有广泛的应用场景。该数据集通过结合视觉和文本信息,为研究人员提供了一个全面的基准测试平台,用于评估和开发视觉语言模型(VLMs)在农业领域的表现。其经典使用场景包括病虫害识别、植物物种分类、疾病诊断以及管理建议生成等任务。这些任务要求模型不仅能够准确理解图像中的细节,还需要具备丰富的农业领域知识。
实际应用
在实际应用中,AgMMU数据集可以支持农业专家系统和智能助手的开发。例如,农民和园艺爱好者可以通过基于该数据集训练的模型,快速识别作物疾病或害虫,并获得相应的管理建议。此外,该数据集还可用于开发农业知识问答系统,帮助用户解决日常种植和管理中的问题。这些应用不仅提高了农业生产的效率,还有助于减少作物损失,提升食品安全。
衍生相关工作
AgMMU数据集已经衍生出多项相关研究和工作。例如,基于该数据集的微调实验显著提升了LLaVA-1.5模型在农业任务上的性能。此外,该数据集还启发了更多关于知识密集型VLMs的研究,特别是在如何将领域专业知识整合到通用模型中的探索。未来,AgMMU有望推动更多针对农业领域的多模态模型开发和评估工作。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作