Aphid Cluster Detection Dataset
收藏arXiv2023-07-12 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2307.05929v1
下载链接
链接失效反馈官方服务:
资源简介:
Aphid Cluster Detection Dataset是由堪萨斯州立大学的研究团队创建的,旨在通过检测蚜虫群来估计感染水平,以支持精确的农药局部应用。该数据集包含从高粱田中手动挑选并标注的5,447张含有蚜虫的图像,进一步被裁剪成超过151,000个图像补丁。创建过程中,研究团队开发了一种三视角的成像装置来捕捉不同高度的蚜虫群,确保数据的多样性和丰富性。该数据集主要应用于农业领域,特别是用于智能农药喷洒系统的开发,以解决蚜虫对作物威胁的问题。
Aphid Cluster Detection Dataset was created by a research team from Kansas State University, aiming to estimate crop infestation levels by detecting aphid clusters to support precision localized pesticide application. This dataset contains 5,447 manually selected and annotated aphid-containing images captured from sorghum fields, which are further cropped into over 151,000 image patches. During the dataset construction, the research team developed a three-view imaging device to capture aphid clusters at different heights, ensuring the diversity and richness of the dataset. This dataset is primarily applied in the agricultural field, especially for the development of intelligent pesticide spraying systems to address the threat posed by aphids to crops.
提供机构:
堪萨斯州立大学
创建时间:
2023-07-12
搜集汇总
数据集介绍

构建方式
在农业害虫监测领域,蚜虫集群检测数据集的构建体现了对精准施药需求的响应。研究团队于高粱田两个生长季内,利用搭载三台GoPro相机的成像装置,从不同高度视角采集了数百万张田间图像。通过人工筛选出5,447张包含蚜虫的图像,并依据农业专家定义的“密集分布且数量不少于六只”的集群标准,采用Labelbox平台对每个蚜虫集群进行精细的语义分割标注,共生成59,767个掩码标签。为适配主流检测模型,原始高分辨率图像被切割为50%重叠的400×400像素图像块,最终形成包含151,380个图像块的数据集,并通过十折交叉验证确保数据分布的均衡性。
特点
该数据集的核心特点在于其针对蚜虫密集聚集的生物特性,创新性地采用集群级检测范式。相较于传统个体检测,数据集以语义分割掩码为基础生成边界框,有效解决了微小目标在复杂田间环境下的识别难题。数据标注遵循严谨的集群定义,通过合并相邻小于10像素的边界框及剔除面积不足图像块1%的微小集群,提升了标注的一致性与模型训练效率。数据集中77%的掩码面积小于5,000像素,呈现典型的小目标分布特征,且通过多视角采集策略增强了场景多样性,为模型应对光照、遮挡等田间挑战提供了丰富样本。
使用方法
该数据集主要服务于基于深度学习的蚜虫集群检测模型开发与评估。研究者可借助其提供的图像块及PASCAL VOC格式的标注文件,直接训练目标检测模型。数据集的十折交叉验证分组支持稳健的模型性能比较,用户可遵循原文划分或重新划分训练集与测试集。在模型训练过程中,建议参考论文采用的训练策略,如使用SGD优化器、学习率阶梯衰减等超参数设置。评估时可采用平均精度与召回率等指标,并通过调整交并比阈值平衡定位精度与检测灵敏度。该数据集还可延伸应用于害虫密度估计、精准施药决策支持等农业智能化场景。
背景与挑战
背景概述
在农业害虫防治领域,蚜虫作为主要威胁之一,对作物产量与全球粮食安全构成严峻挑战。传统化学防治方法虽能提升产量,但大面积施药易导致环境污染与成本浪费,因此精准定位蚜虫并评估其侵染程度成为实现靶向施药的关键。2023年,由堪萨斯大学、堪萨斯州立大学及多伦多城市大学的研究团队联合构建了Aphid Cluster Detection Dataset,该数据集聚焦于高粱田间的蚜虫集群检测问题。通过在两季生长周期中采集数百万张图像,团队人工筛选出5,447张包含蚜虫的图像,并以“超过六只紧密聚集的蚜虫”为标准标注了59,767个蚜虫集群,进而裁剪生成超过15.1万张图像块,为农业机器人视觉系统提供了重要的数据基础。这一工作不仅推动了精准农业的发展,也为小目标检测算法在复杂自然环境中的应用设立了新的基准。
当前挑战
蚜虫检测的核心挑战在于其个体微小且密集聚集的特性,导致现有目标检测模型难以准确分割与定位单个蚜虫。在复杂田间环境中,叶片遮挡、光照变化及背景干扰进一步加剧了模型泛化难度,使得传统方法在真实场景中表现受限。数据构建过程中,研究团队面临多重困难:首先,蚜虫集群形态多样且边界模糊,需结合农学知识制定统一的标注标准以确保数据一致性;其次,原始图像分辨率高而蚜虫集群占比极小,需通过重叠裁剪与边界框合并等预处理策略平衡检测效率与特征保留;此外,数据标注依赖人工筛选与专业判断,耗时耗力且需协调多领域专家协作。这些挑战共同凸显了在动态农业场景中实现鲁棒性害虫检测的复杂性。
常用场景
经典使用场景
在农业害虫监测领域,蚜虫作为主要作物威胁之一,其密集集群特性使得传统个体检测方法面临巨大挑战。Aphid Cluster Detection Dataset通过在高粱田间采集数百万张图像,并手工标注了5,447张包含蚜虫的图像,将超过151,000个图像块构建为标注数据集。该数据集最经典的使用场景在于训练和评估目标检测模型,以识别和定位蚜虫集群而非单个蚜虫,从而更有效地估计虫害感染水平。这一方法显著提升了检测效率,为精准农业中的虫害管理提供了可靠的数据基础。
解决学术问题
该数据集解决了农业计算机视觉中微小目标检测的学术难题。传统方法试图检测单个蚜虫,但由于蚜虫体型极小且密集聚集,检测精度往往不理想。通过定义蚜虫集群(即六个以上紧密分布的蚜虫区域)并标注边界框,数据集缓解了密集小目标检测中的标注模糊性和模型训练困难。它促进了自适应训练样本选择、定位质量估计等先进检测算法的应用,为微小生物群体检测提供了新的研究范式,推动了目标检测技术在复杂农业环境中的理论进展。
衍生相关工作
基于该数据集,多项经典研究工作得以推进。论文中比较了四种先进目标检测模型(ATSS、GFLV2、PAA、VFNet)在蚜虫集群检测上的性能,为后续研究提供了基准。这些模型通过自适应IoU阈值、定位质量估计等技术优化了检测精度。此外,数据集的集群标注策略启发了其他农业害虫检测研究,如TD-Det网络针对田间环境的密集蚜虫检测。相关工作还扩展到跨域目标检测和动态标签分配等领域,丰富了农业视觉分析的算法库。
以上内容由遇见数据集搜集并总结生成



