Cashew Leaves Dataset
收藏arXiv2023-04-18 更新2024-06-21 收录
下载链接:
https://www.kaggle.com/datasets/varshajayaprakash/cashew-leaves-healthy-and-anthracnose-infected
下载链接
链接失效反馈官方服务:
资源简介:
腰果叶数据集是由VIT Chennai的电子工程学院创建,专门用于腰果叶和果实疾病的识别,特别是Anthracnose病害。该数据集包含20,127张图像,涵盖了健康和病变的腰果叶和果实。数据集的创建过程包括使用RGB颜色变换、几何和光度学增强以及RaLSGAN来增加图像的多样性和真实性。此数据集主要应用于农业领域,特别是通过无人机技术实时监测和诊断腰果树的健康状况,以提高农业生产效率和减少化学农药的使用。
The Cashew Leaf Dataset was developed by the School of Electrical Engineering at VIT Chennai, specifically designed for the identification of diseases affecting cashew leaves and fruits, particularly Anthracnose. This dataset contains 20,127 images covering both healthy and diseased cashew leaves and fruits. The dataset construction process uses RGB color transformation, geometric and photometric augmentation, as well as RaLSGAN to enhance the diversity and authenticity of the images. This dataset is primarily applied in the agricultural sector, especially for real-time monitoring and diagnosis of cashew tree health status via unmanned aerial vehicle (UAV) technology, to improve agricultural production efficiency and reduce the use of chemical pesticides.
提供机构:
电子工程学院,VIT 钦奈
创建时间:
2023-04-18
搜集汇总
数据集介绍

构建方式
在农业病害智能检测领域,高质量数据集的构建是模型性能的基石。Cashew Leaves Dataset的构建采用了一种渐进式的多阶段方法,旨在克服初始数据稀缺的挑战。首先,研究团队在印度泰米尔纳德邦的腰果农场中,使用智能手机采集了1200张原始图像,涵盖健康与感染炭疽病的叶片与果实,图像分辨率为1080×1080像素。为扩充数据规模并增强多样性,第二阶段对原始图像实施了系统的几何与光度学增强,包括旋转、缩放、剪切变换及色彩抖动等操作,生成了包含5000张图像的增强数据集。第三阶段则引入了先进的RaLSGAN(相对平均最小二乘生成对抗网络),通过生成高真实感的合成图像,将数据集最终扩展至20,127张图像,有效提升了数据集的代表性与模型的泛化能力。
特点
该数据集在植物病害图像数据领域展现出若干鲜明特征。其核心价值在于专门针对腰果炭疽病这一重要经济病害,填补了该细分领域公开数据集的空白。数据集规模庞大且构成多元,不仅包含高分辨率的原始田间图像,还融入了经严格增强处理的样本以及由RaLSGAN生成的合成图像,确保了数据在光照、角度、背景及病害表现形态上的高度多样性。图像内容聚焦于叶片与果实的健康与病害状态,其中健康类样本占比约81%,炭疽病感染类样本占比约19%,类别划分清晰。数据集的构建充分考虑了边缘计算设备的应用场景,图像质量经过优化,使其能够兼容从高端相机到低质量无人机摄像头的多种采集设备,为资源受限环境下的实时病害检测提供了坚实的数据基础。
使用方法
该数据集主要服务于基于深度学习的腰果病害自动检测与分类研究。使用者可首先将数据集按80:20的比例划分为训练集与测试集,其中训练集包含16,101张图像,测试集包含4,026张图像。为适配轻量化模型部署需求,推荐采用迁移学习策略,例如利用在ImageNet上预训练的MobileNet或Inception等网络架构作为特征提取器,并在其顶层添加自定义的分类层进行微调。在模型训练前,可对图像进行诸如RGB色彩变换等预处理,以突出病害区域特征。训练完成后,模型可进一步通过TensorFlow Lite转换为适用于边缘设备的格式,并应用动态范围量化或整数量化等后训练优化技术,以显著压缩模型体积、降低推理延迟,最终实现将其部署于无人机或嵌入式系统,进行实时的田间病害监测与诊断。
背景与挑战
背景概述
Cashew Leaves Dataset 是由印度韦洛尔理工学院的研究团队于近年构建的专门针对腰果树叶片炭疽病检测的视觉数据集。该数据集旨在解决腰果种植中因树体高大、病害难以人工快速识别而导致的产量损失问题,核心研究聚焦于利用计算机视觉与深度学习技术实现腰果树叶片健康状况的自动化诊断。通过整合原始采集图像、几何与光度增强数据以及生成对抗网络合成的样本,该数据集为农业病害智能检测领域提供了首个公开的腰果病害专项数据资源,推动了 TinyML 在农业边缘计算中的应用,对精准农业与可持续作物管理具有重要的实践价值。
当前挑战
该数据集致力于解决腰果树炭疽病的自动化视觉检测挑战,其核心难题在于如何在复杂自然环境与有限数据条件下实现高精度、轻量化的病害分类。具体构建过程中的挑战包括:原始图像数据规模较小,需通过几何与光度增强以及 RaLSGAN 生成对抗网络进行有效扩充以提升模型泛化能力;图像采集受光照、角度及背景干扰影响,需通过 RGB 色彩转换等技术突出病害特征;同时,为适配无人机等边缘设备部署,需在保持高分类准确率的前提下,通过模型量化与优化大幅压缩计算资源与存储占用,实现实时低功耗推理。
常用场景
经典使用场景
在农业病害智能诊断领域,Cashew Leaves Dataset 为腰果炭疽病的自动化识别提供了核心数据支撑。该数据集通过几何与光度增强、RGB色彩转换以及RaLSGAN生成对抗网络技术,构建了包含健康与染病叶片图像的大规模样本库。其经典应用场景在于训练轻量化深度学习模型,如MobileNet和Inception,实现高精度二元分类,为资源受限环境下的实时病害检测系统奠定数据基础。
解决学术问题
该数据集有效解决了农业信息学中腰果病害公开数据稀缺的瓶颈问题,为小样本条件下的模型训练提供了系统化解决方案。通过融合数据增强与生成对抗技术,缓解了深度学习模型因数据不足导致的过拟合与泛化能力弱等挑战。其构建方法论为类似作物病害数据集的创建提供了可复现的范式,推动了植物病理学与计算机视觉的跨学科融合,提升了病害识别研究的可扩展性与鲁棒性。
衍生相关工作
基于该数据集的方法论,衍生出多项专注于作物病害智能检测的创新研究。例如,采用注意力机制与残差网络结合的架构优化病害特征提取;探索贝叶斯卷积网络以量化模型预测不确定性;结合元启发式优化算法调整深度神经网络超参数。这些工作进一步推动了轻量化模型在移动设备与嵌入式系统上的部署,形成了从数据生成、模型优化到边缘应用的全链条技术演进,为智慧农业的实时决策系统提供了连续性的研究基础。
以上内容由遇见数据集搜集并总结生成



