MangoLeafDB-C
收藏arXiv2025-12-16 更新2025-12-17 收录
下载链接:
https://www.kaggle.com/datasets/aryashah2k/mango-leaf-disease-dataset/data
下载链接
链接失效反馈官方服务:
资源简介:
MangoLeafDB-C是由阿拉戈斯联邦大学团队基于原始MangoLeafDB数据集构建的芒果叶病害分析增强数据集,包含8类病害的4000张叶片图像。该数据集通过引入19种人工合成 corruption(如模糊、噪声、光照变化等)在5种严重程度下的组合,扩展为95个子集,旨在模拟真实农业场景中的图像退化情况。数据来源于孟加拉国芒果种植区的实地采集,经标准化预处理至224×224像素分辨率。该数据集主要用于评估卷积神经网络在农业边缘计算场景下对叶片病害诊断的鲁棒性,为解决实际应用中因图像质量波动导致的模型性能下降问题提供基准测试平台。
MangoLeafDB-C is an enhanced dataset for mango leaf disease analysis developed by the team from Federal University of Alagoas based on the original MangoLeafDB dataset. It contains 4000 leaf images across 8 disease categories. This dataset is expanded into 95 subsets by incorporating 19 types of artificially synthesized image corruptions (including blur, noise, illumination variation, etc.) across 5 severity levels, with the goal of simulating image degradation conditions in real-world agricultural scenarios. The data was field-collected from mango planting areas in Bangladesh, and standardized and preprocessed to a resolution of 224×224 pixels. This dataset is primarily used to evaluate the robustness of convolutional neural networks (CNNs) for leaf disease diagnosis in agricultural edge computing scenarios, serving as a benchmark platform to address the problem of model performance degradation caused by fluctuating image quality in practical applications.
提供机构:
阿拉戈斯联邦大学计算机研究所, 北里奥格兰德联邦大学技术中心
创建时间:
2025-12-16
搜集汇总
数据集介绍

构建方式
在农业人工智能系统领域,确保模型在现实世界复杂环境中的鲁棒性至关重要。MangoLeafDB-C数据集的构建源于对芒果叶病害诊断模型在图像失真条件下性能评估的需求。该数据集以原始的MangoLeafDB为基础,通过系统化引入19种常见数字失真类型,包括亮度变化、对比度调整、散焦模糊、运动模糊、噪声干扰及天气模拟等,每种失真均设置了五个严重程度等级。利用Python环境下的scipy、wand及ImageMagick等工具,对原始数据集中的4000张图像逐类应用失真处理,生成95个子集,完整保留了原始八类病害与健康叶片的分类结构,从而构建了一个全面模拟现实采集缺陷的基准测试平台。
特点
MangoLeafDB-C的核心特征在于其系统化的失真覆盖与分级设计,为评估卷积神经网络在农业视觉任务中的鲁棒性提供了标准化基准。数据集囊括了从几何变形、压缩伪影到环境噪声的多维度失真类型,每种类型均通过五个渐进严重等级实现量化控制,使得研究者能够精确分析模型性能随失真强度变化的降解模式。其结构严格遵循原始数据集的类别平衡,确保了评估的公平性与可比性。该数据集特别强调了在边缘计算设备常见场景下的实用性,如移动端图像采集中出现的模糊、噪声及光照变异等问题,为轻量级与专用模型的稳健性验证提供了关键数据支持。
使用方法
MangoLeafDB-C主要用于系统评估卷积神经网络在芒果叶病害诊断任务中对图像失真的鲁棒性。使用方法遵循严格的基准测试协议:首先,模型仅在干净的MangoLeafDB数据集上进行训练;随后,使用MangoLeafDB-C的所有失真子集作为测试数据,全面评估模型在各种失真类型与严重程度下的性能表现。评估过程需计算宏平均F1分数、失真错误率及相对平均失真错误率等指标,以量化模型在理想条件与失真条件下的性能差距。通过对比不同架构(如ResNet、VGG、Xception及专用轻量网络LCNN)在这些指标上的表现,研究者能够深入洞察模型的结构特性与鲁棒性之间的关联,为农业边缘智能设备的模型选择与优化提供实证依据。
背景与挑战
背景概述
在农业智能化浪潮中,芒果作为全球第五大栽培水果,其叶片病害的精准诊断对保障产量与可持续生产至关重要。传统病害识别方法依赖专家经验,效率低下且难以规模化,而基于深度学习的计算机视觉技术为自动化诊断提供了新途径。MangoLeafDB-C数据集由巴西阿拉戈斯联邦大学等机构的研究团队于2025年构建,旨在评估卷积神经网络在芒果叶片病害识别任务中的鲁棒性。该数据集基于原始的MangoLeafDB扩展而来,引入了19种人工模拟的图像损坏类型,每种设置五个严重等级,以模拟真实田间环境中可能遇到的噪声、模糊及天气变化等挑战。其核心研究聚焦于验证轻量级与复杂模型在非理想成像条件下的性能表现,推动农业人工智能系统在边缘设备上的可靠部署,对热带与亚热带地区的精准农业发展具有显著影响力。
当前挑战
MangoLeafDB-C数据集致力于解决芒果叶片病害自动诊断模型在真实复杂环境中的鲁棒性评估问题。领域内核心挑战在于,现有高精度模型在实验室理想条件下表现优异,但面对自然图像损坏时性能急剧下降,难以在资源受限的田间边缘设备中稳定应用。构建过程中的挑战主要体现在数据模拟的全面性与真实性平衡:需系统性地生成涵盖几何畸变、压缩伪影、天气模拟及传感器噪声等多维损坏类型,并合理定义严重等级以覆盖从轻微到极端的退化场景;同时,确保损坏施加过程不破坏叶片病害的关键形态特征,以维持分类任务的有效性,这要求对农业图像特性与损坏算法的深度融合理解。
常用场景
经典使用场景
在农业人工智能领域,MangoLeafDB-C数据集被广泛用于评估卷积神经网络在芒果叶片病害诊断任务中的鲁棒性。该数据集通过引入19种合成图像损坏类型,模拟了真实环境中可能出现的噪声、模糊和天气变化等不利条件,为研究者提供了一个标准化的测试平台。经典使用场景包括对比不同CNN架构在损坏图像上的性能表现,特别是针对轻量级模型与复杂模型在边缘计算环境下的稳定性分析,从而推动鲁棒性评估方法在农业智能系统中的应用。
解决学术问题
MangoLeafDB-C数据集解决了农业计算机视觉中模型鲁棒性评估的学术研究问题。传统病害诊断模型通常在理想图像条件下表现优异,但在实际部署中易受图像质量下降的影响。该数据集通过系统化的损坏模拟,使得研究者能够量化模型在多种失真情况下的性能衰减,识别模型对特定损坏类型的脆弱性。其意义在于填补了芒果叶片病害诊断领域缺乏鲁棒性基准的空白,促进了模型验证与验证流程的标准化,为开发适应真实世界挑战的可靠智能系统提供了关键数据支持。
衍生相关工作
MangoLeafDB-C数据集衍生了多项经典研究工作,主要集中在轻量级模型设计与鲁棒性增强策略领域。受其启发,研究者开发了专门针对农业图像损坏的对抗训练方法,以及融合多尺度特征提取的噪声抵抗架构。例如,后续工作扩展了数据集的损坏类型,纳入更多真实世界扰动如阴影和污渍,并探索了跨作物病害诊断的泛化能力。此外,该数据集促进了边缘设备上模型部署的优化研究,包括模型压缩与动态推理机制的结合,以在保持鲁棒性的同时降低计算开销,推动了农业人工智能系统向实用化与高效化发展。
以上内容由遇见数据集搜集并总结生成



