Plants in Wild

Name: Plants in Wild
Creator: Sensyne Health PLC
Published: 2021-09-21 12:20:18
License: 暂无描述

arXiv2021-09-21 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2109.09952v1

下载链接

链接失效反馈

官方服务：

资源简介：

Plants in Wild数据集由Sensyne Health PLC创建，包含1980张在真实环境中拍摄的植物图像，涵盖健康和患病状态。数据集通过互联网公开资源收集，主要用于农业领域的计算机视觉应用，旨在解决植物病害自动分类的问题。该数据集的创建过程涉及图像的收集、预处理和分类，以适应不同的研究需求。

The Plants in Wild dataset was created by Sensyne Health PLC. It contains 1980 plant images captured in real-world environments, covering both healthy and diseased plant conditions. The dataset was collected from publicly available internet resources, is mainly used for computer vision applications in the agricultural field, and aims to address the problem of automatic plant disease classification. The creation process of this dataset involves image collection, preprocessing and categorization to adapt to different research requirements.

提供机构：

Sensyne Health PLC

创建时间：

2021-09-21

搜集汇总

数据集介绍

构建方式

在农业计算机视觉领域，真实环境下的植物病害识别面临数据稀缺的挑战。Plants in Wild数据集旨在弥补这一缺口，其构建过程依托于公开网络资源，如Eden Library等平台，系统性地采集了自然场景中健康与患病植物的图像。所有样本均通过智能手机摄像头在多样化的农田与农场环境中拍摄，涵盖了不同光照、背景及拍摄角度，确保了数据的真实性与复杂性。经过预处理步骤，包括图像尺寸调整与中心裁剪，最终形成了包含10类健康植物与10类对应病害植物的1980张图像集合，为少样本学习提供了贴近实际应用场景的基准数据。

特点

该数据集的核心特点在于其高度贴近真实世界的图像采集条件。与实验室环境下单一叶片、对比背景的现有植物数据集不同，Plants in Wild中的图像呈现了自然光照、复杂背景及植株整体形态，模拟了实际农业巡检中常见的视觉场景。数据集中健康与病害类别一一对应，如健康番茄与番茄病毒病，形成了清晰的对比学习框架。这种真实世界的多样性不仅提升了模型的鲁棒性要求，也为跨领域少样本学习研究提供了更具挑战性的评估平台，推动了农业视觉系统从理想条件向实际应用的过渡。

使用方法

在少样本学习框架下，该数据集通常被划分为元训练集与元测试集，且类别互斥，以支持单领域、混合领域及跨领域等多种实验设置。研究人员可依据标准少样本协议，构建N-way M-shot分类任务，从数据集中采样支持集与查询集。通过结合特征提取网络（如ResNet-18）生成嵌入表示，并利用Transformer架构进行上下文适配，增强任务特定特征。随后采用马氏距离等基于类协方差的度量方式计算相似度，完成分类。该流程不仅为评估少样本学习算法在真实农业场景中的泛化能力提供了标准基准，也促进了模型在有限标注下的快速适应与部署。

背景与挑战

背景概述

在农业智能化的浪潮中，植物病虫害的自动识别技术对于提升作物产量与保障粮食安全具有关键意义。然而，传统深度学习模型依赖海量标注数据，难以适应田间复杂多变的实际环境。为此，Sai Vidyaranya Nuthalapati与Anirudh Tunga等研究人员于2021年提出了'Plants in Wild'数据集，旨在推动少样本学习在农业领域的应用。该数据集聚焦于真实野外场景下健康与患病植物的图像分类，涵盖了芹菜、番茄、玉米等10类健康植物及其对应的10类病害样本，共计1980张图像。通过模拟智能手机拍摄的多样化光照、背景与姿态条件，该数据集突破了以往实验室环境下单一叶片图像的局限，为开发鲁棒的农业视觉系统提供了重要基础。

当前挑战

该数据集致力于解决农业领域中少样本图像分类的挑战，尤其在真实野外环境下植物健康状态的精准识别。具体而言，其核心挑战体现在两个方面：其一，领域问题的复杂性，即如何从有限样本中学习具有强泛化能力的特征，以区分高度相似的不同植物物种及其病害形态，同时应对跨领域场景中特征分布差异的难题；其二，数据构建过程中的实际困难，包括采集真实田间图像时面临的光照不均、背景杂乱、植株遮挡以及拍摄角度多变等干扰因素，这些因素使得图像质量与一致性难以控制，从而增加了标注难度与模型训练的复杂性。

常用场景

经典使用场景

在农业计算机视觉领域，Plants in Wild数据集作为少样本学习的重要基准，其经典使用场景聚焦于模拟真实环境下的植物病害识别。该数据集通过采集智能手机拍摄的田间图像，涵盖了健康与患病植物的多样化样本，为研究者提供了评估模型在复杂光照、背景及姿态变化下泛化能力的平台。其设计初衷在于弥补实验室环境下单一叶片图像的局限性，推动算法向实际应用场景的迁移。

衍生相关工作

围绕Plants in Wild数据集，衍生出一系列聚焦少样本农业图像分析的经典工作。例如，结合Transformer架构的嵌入自适应方法被广泛采纳，以增强特征表示的判别能力；同时，基于马氏距离的度量学习框架成为改进跨领域分类性能的主流方向。这些工作进一步推动了多领域少样本学习理论的发展，并为后续研究如跨物种病害迁移识别等课题奠定了实验基础。

数据集最近研究