Citrus Pest Benchmark (CPB)
收藏arXiv2020-04-22 更新2024-06-21 收录
下载链接:
https://github.com/edsonbollis/Citrus-Pest-Benchmark
下载链接
链接失效反馈官方服务:
资源简介:
本研究创建了名为Citrus Pest Benchmark (CPB)的数据集,由复杂数据推理实验室(RECOD)开发。该数据集包含10,816张图像,分为七个类别,主要用于农业领域的柑橘害虫识别。数据集中的图像通过移动设备结合放大镜拍摄,涵盖了六种螨类害虫和一种负样本类别。创建过程涉及在巴西的São José农场进行定期检查,采集害虫图像。该数据集旨在通过自动化技术辅助集成害虫管理(IPM),提高农业害虫检测的效率和准确性。
This study developed a dataset named Citrus Pest Benchmark (CPB), which was constructed by the Complex Data Reasoning Laboratory (RECOD). This dataset contains 10,816 images grouped into seven classes, and is primarily intended for citrus pest recognition in the agricultural field. All images in the dataset were captured using mobile devices equipped with magnifying glasses, covering six categories of mite pests and one negative sample class. The dataset creation process involved regular inspections at the São José Farm in Brazil to collect pest images. This dataset aims to support Integrated Pest Management (IPM) through automated technologies, thereby improving the efficiency and accuracy of agricultural pest detection.
提供机构:
复杂数据推理实验室 (RECOD)
创建时间:
2020-04-22
搜集汇总
数据集介绍

构建方式
在农业病虫害智能识别领域,数据集的构建质量直接影响模型的泛化能力。Citrus Pest Benchmark (CPB) 数据集的构建过程体现了严谨的科学采集流程。研究团队在巴西圣保罗州的柑橘农场中,通过移动设备结合60倍放大镜头,在专业虫害管理人员的指导下,于2018年3月至2019年1月间进行了系统性图像采集。采集过程遵循了标准的田间采样协议,通过巡检特定行列的柑橘树,对果实、新芽和茎干进行取样拍摄,最终构建了一个包含六类螨虫物种及一个阴性类别的多类别图像集合。数据集总计包含10,816张高分辨率图像,并按照约60%、20%、20%的比例划分为训练集、验证集和测试集,确保了评估的公正性与可靠性。
特点
该数据集在农业害虫视觉识别领域具有鲜明的独特性。其核心特点在于图像中目标对象的尺度极小,螨虫在整张图像中所占区域比例微小,这为识别任务带来了显著挑战。图像均通过移动设备在田间直接采集,部分图像因设备玻璃表面而存在模糊现象,且光照条件与放大倍数存在差异,进一步模拟了真实应用场景的复杂性。数据集中包含约5%的图像同时存在多个类别的螨虫,构成了多标签分类问题。与以往主要依赖网络爬虫构建的数据集不同,CPB的所有图像均遵循严格的实地采集协议获得,为移动端农业害虫识别研究提供了首个专门针对柑橘螨虫的、贴近实际应用的高质量基准。
使用方法
该数据集主要用于开发和评估针对微小目标的弱监督图像分类方法。典型的使用流程始于利用在ImageNet上预训练的卷积神经网络在CPB的完整图像上进行初步训练,获得一个基础模型。随后,通过梯度加权类激活映射技术生成显著图,并据此自动定位图像中可能包含害虫的关键区域,提取多个图像块。这些图像块与其源图像共享标签,构成一个多示例学习框架下的实例数据集。接着,在此实例数据集上对基础模型进行微调,学习更精细的特征。最终,通过一个加权评估策略,综合所有图像块的预测概率,得出整张图像的分类结果。该方法有效降低了对精细标注的依赖,为在资源受限的移动设备上实现高效的田间害虫自动识别提供了可行的技术路径。
背景与挑战
背景概述
柑橘害虫基准数据集(Citrus Pest Benchmark, CPB)由巴西坎皮纳斯大学计算研究所的视觉信息实验室(LIV)与复杂数据推理实验室(RECOD)于2020年联合创建,旨在应对农业领域害虫智能识别的迫切需求。该数据集聚焦于柑橘作物中六类螨虫物种及阴性样本的精细分类,其图像通过移动设备结合放大镜头在田间实地采集,共计10,816张高分辨率样本。CPB的构建填补了现有农业害虫数据集中微小目标检测的空白,为集成害虫管理(IPM)的自动化提供了关键数据支撑,推动了计算机视觉技术在精准农业中的应用演进。
当前挑战
CPB数据集所针对的领域核心挑战在于微小目标分类问题:螨虫在图像中占比极小,且类间形态相似度高,加之田间采集时光照、模糊及背景干扰显著,传统卷积神经网络直接处理效率低下。构建过程中的挑战则体现于数据标注的复杂性:由于目标尺寸微小,全监督标注需耗费巨大人力,且易因视觉疲劳产生误差;为此,研究者创新性地引入弱监督学习方法,通过显著性映射自动定位兴趣区域,以降低标注成本,但如何平衡伪标签生成精度与模型泛化能力仍存探索空间。
常用场景
经典使用场景
在农业病虫害智能识别领域,Citrus Pest Benchmark(CPB)数据集为柑橘类作物害虫的精细分类提供了关键基准。该数据集通过移动设备结合放大镜头采集,包含六类微小螨虫物种及阴性样本,图像中目标区域占比极小且存在模糊干扰,这使其成为评估弱监督学习与多实例学习方法的理想平台。研究者通常利用CPB验证卷积神经网络在复杂农业场景下的分类性能,特别是在缺乏精确标注的情况下,如何通过显著性映射自动定位感兴趣区域,从而提升模型对微小害虫的识别能力。
实际应用
在实际农业生产中,CPB数据集为集成害虫管理(IPM)的智能化升级提供了技术支撑。基于该数据集训练的模型可部署于移动设备,辅助田间巡检人员实时识别柑橘叶片与果实上的螨虫物种,替代传统依赖人眼观察的繁琐流程。这种自动化识别系统能够快速判断害虫密度是否超过安全阈值,从而及时触发精准施药或植株处理决策,减少化学农药滥用,提升作物产量与品质。此外,该技术有助于小型农场降低人力成本与操作误差,推动智慧农业在病虫害防控环节的落地应用。
衍生相关工作
围绕CPB数据集,学术界衍生出一系列经典研究工作。原论文提出的弱监督多实例学习框架,结合显著性映射(Patch-SaliMap)与加权评估策略,为微小目标分类设立了新范式。后续研究在此基础上探索了更高效的网络架构适配,如将EfficientNet等轻量化模型与注意力机制结合,以提升移动端部署性能。同时,CPB与IP102等大型害虫数据集的对比分析,推动了跨领域迁移学习与领域自适应方法的发展。这些工作不仅深化了农业图像识别的理论基础,也为其他微小目标检测场景(如医学影像分析、遥感图像解译)提供了可借鉴的技术路径。
以上内容由遇见数据集搜集并总结生成



