LeafNet

Name: LeafNet
Creator: 高丽大学·电气工程学院; 德克萨斯大学奥斯汀分校·综合生物学系; FPT大学·软件工程系
Published: 2026-02-18 00:47:13
License: 暂无描述

arXiv2026-02-18 更新2026-02-19 收录

下载链接：

https://github.com/EnalisUs/LeafBench

下载链接

链接失效反馈

官方服务：

资源简介：

LeafNet是由高丽大学、德克萨斯大学奥斯汀分校和FPT大学联合构建的大规模植物病害多模态数据集，包含18.6万张数字叶片图像，涵盖97种病害类别，并配合作物种类、病原体、症状描述等结构化元数据。数据通过权威机构（如NIH、NIFA）的元数据映射和农业专家验证流程构建，生成13,950个问答对用于视觉问答任务。该数据集旨在解决农业领域跨作物病害识别的泛化难题，支持少样本学习、零样本推理和视觉语言模型在植物病理学中的诊断精度提升。

LeafNet is a large-scale multimodal plant disease dataset jointly constructed by Korea University, The University of Texas at Austin, and FPT University. It comprises 186,000 digital leaf images covering 97 disease categories, with structured metadata including crop species, pathogens, and symptom descriptions. The dataset is built through metadata mapping from authoritative institutions such as the National Institutes of Health (NIH) and the National Institute of Food and Agriculture (NIFA), as well as an agricultural expert validation workflow. Additionally, 13,950 question-answer pairs are generated for visual question answering (VQA) tasks. This dataset aims to address the generalization challenge of cross-crop disease recognition in the agricultural domain, and supports few-shot learning, zero-shot inference, and the improvement of diagnostic accuracy of vision-language models in phytopathology.

提供机构：

高丽大学·电气工程学院; 德克萨斯大学奥斯汀分校·综合生物学系; FPT大学·软件工程系

创建时间：

2026-02-14

搜集汇总

数据集介绍

构建方式

在植物病理学领域，构建高质量的多模态数据集对于推动智能诊断技术的发展至关重要。LeafNet的构建过程遵循严谨的学术规范，首先从美国国家卫生研究院（NIH）和国家食品与农业研究所（NIFA）等权威机构合成元数据，将原始图像映射到包括物种、疾病、病原体和症状描述在内的生物分类体系。随后，所有图像与元数据配对样本均经过农业领域专家的严格审查，以过滤噪声数据并确保视觉症状与文本描述的一致性。通过这一人工参与的验证流程，最终形成了包含18.6万张叶片图像的大规模标准化数据集，为视觉-语言模型提供了坚实的训练基础。

使用方法

LeafNet数据集及其衍生的LeafBench基准为植物病害智能诊断研究提供了多层次的应用框架。在基础视觉任务中，研究者可利用完整的图像数据集进行大规模监督分类，通过线性探测或全参数微调评估不同视觉骨干网络的表征能力。针对数据稀缺场景，数据集的少样本分类协议允许在每类仅16、32或64个样本的条件下测试模型的数据效率。对于高级语义理解，LeafBench基准提供了包含六类诊断任务的13,950个视觉问答对，涵盖从健康-病害二元分类到病原体分类和症状识别等复杂任务。这种结构化设计使得研究者能够系统评估视觉-语言模型在封闭候选集约束下的推理能力，为领域专用模型的开发与比较提供了标准化测试平台。

背景与挑战

背景概述

随着全球粮食安全挑战日益严峻，植物病害导致的作物减产问题亟待解决。在此背景下，由Khang Nguyen Quoc、Phuong D. Dao和Luyl-Da Quach等研究人员于2026年共同构建的LeafNet数据集应运而生。该数据集旨在为植物病理学领域提供大规模、多模态的基础资源，以支持视觉-语言模型在农业病害诊断中的深入研究。LeafNet汇集了来自7个国家的18.6万张叶片图像，涵盖22种常见作物和62种病害，并配有丰富的专家标注元数据。其核心研究问题聚焦于如何利用多模态数据提升模型对复杂病害症状的语义理解与跨任务推理能力，为精准农业中的智能诊断系统奠定数据基础。

当前挑战

LeafNet致力于解决植物病害视觉-语言理解中的核心挑战，即在复杂环境背景下实现细粒度病害识别与跨模态语义对齐。具体而言，该领域面临相似症状区分困难、跨作物泛化能力不足等难题。在数据集构建过程中，研究团队遭遇了多重挑战：首先，从异构数据源整合图像时需确保生物学分类的准确性，这依赖于对NIH、NIFA等权威分类体系的严格映射；其次，多模态标注需要农业专家进行人工验证，以过滤噪声样本并保证症状描述与视觉特征的一致性；此外，构建评测基准LeafBench时需设计层次化诊断任务，从二分类到细粒度病原体识别，以系统评估模型在零样本、少样本等场景下的推理能力。

常用场景

经典使用场景

在植物病理学与智慧农业领域，LeafNet数据集为视觉-语言模型的训练与评估提供了关键支撑。其经典使用场景集中于构建多模态诊断系统，通过结合18.6万张叶片图像与丰富的专家标注元数据，支持模型在图像分类、少样本学习及视觉问答等任务上进行系统性训练。该数据集特别适用于开发能够理解植物病害视觉症状与生物学描述的智能系统，为精准农业中的病害识别与决策提供数据基础。

解决学术问题

LeafNet数据集有效解决了植物病害识别研究中数据规模有限、模态单一及泛化能力不足等核心学术问题。通过提供大规模、多模态且标准化的图像-文本对，该数据集促进了视觉-语言模型在植物病理学领域的适应性研究，特别是在少样本与零样本学习场景下，模型能够利用文本语义增强对罕见病害的识别能力。其意义在于推动了农业人工智能从单纯图像分类向多模态语义理解的范式转变，为构建可解释、可泛化的智能诊断系统奠定了数据基石。

实际应用

在实际应用层面，LeafNet数据集为开发田间智能诊断工具提供了重要数据资源。基于该数据集训练的模型可集成于移动应用或无人机监测系统，实现实时病害检测与分类，辅助农民进行早期干预。例如，模型可通过分析叶片图像，结合症状描述精准识别病害类型、病原体及严重程度，从而推荐个性化防治策略。这种应用不仅提升了病害管理效率，也有助于减少农药滥用，促进可持续农业发展。

数据集最近研究