five

Plant Pathology 2020 challenge dataset

收藏
arXiv2020-04-25 更新2024-06-21 收录
下载链接:
https://www.kaggle.com/c/plantpathology-2020-fgvc7
下载链接
链接失效反馈
官方服务:
资源简介:
Plant Pathology 2020挑战数据集由康奈尔大学创建,包含3651张高质量的真实苹果叶片病害症状图像,涵盖多种光照、角度、表面和噪声条件。数据集通过专家标注,用于训练和测试卷积神经网络模型,以实现苹果叶片病害的自动分类。该数据集主要应用于农业领域,旨在通过机器学习技术实现快速准确的病害检测,以支持苹果园的病害管理。

The Plant Pathology 2020 Challenge Dataset, developed by Cornell University, consists of 3,651 high-quality real-world images depicting symptoms of apple leaf diseases. The dataset covers diverse scenarios including varying lighting conditions, shooting angles, leaf surface states and noise interference. It has been expertly annotated, and is specifically designed for training and testing convolutional neural network (CNN) models to enable automatic classification of apple leaf diseases. Primarily applied in the agricultural domain, this dataset aims to facilitate rapid and accurate disease detection through machine learning techniques, thereby supporting disease management in apple orchards.
提供机构:
康奈尔大学
创建时间:
2020-04-25
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建方式是通过在2019年生长季节,从纽约Geneva的商业种植品种中手动捕获了3651张高质量的、真实生活中苹果叶部疾病的症状图像,包括苹果黑星病、苹果锈病和健康叶子。这些图像在不同的光照、角度、表面和噪声条件下拍摄,以反映现实世界的场景。然后,专家对这些图像进行了注释,以创建一个包含苹果黑星病、苹果锈病和健康叶子的数据集。最后,数据集被随机分为训练集和分层测试集,分别占80%和20%,以确保两个数据集都包含所有四种疾病类别。
特点
该数据集的特点包括:(1)包含不同疾病类别的非平衡数据集;(2)具有非均匀背景的图像;(3)在一天中不同时间拍摄的图像;(4)来自不同生理年龄的植物的图像;(5)同一图像中存在多种疾病的图像;(6)具有不同焦点的图像。此外,数据集包含3651张高质量的RGB图像,包括1200张苹果黑星病、1399张苹果锈病、187张复杂疾病模式和865张健康叶子。
使用方法
该数据集的使用方法包括:(1)使用预训练的ResNet50网络对数据进行微调,以对苹果黑星病、苹果锈病、复杂疾病模式和健康叶子进行分类;(2)在Kaggle社区举办'Plant Pathology Challenge'竞赛,以促进机器学习模型的开发;(3)继续向数据集中添加更多图像,以建立一个更大、更全面的数据集,以支持更先进的方法进行疾病分类和量化。
背景与挑战
背景概述
植物病理学在农业生产中扮演着至关重要的角色,尤其是在苹果产业中。美国苹果产业每年价值150亿美元,但由于病原体和昆虫的威胁,每年都会遭受数百万美元的损失。为了及时有效地进行疾病管理,早期疾病检测至关重要。然而,传统的疾病检测方法依赖于人工检查,这种方法既耗时又昂贵,且准确性难以保证。为了解决这个问题,Ranjita Thapa等人创建了一个包含3651张高质量苹果叶部疾病症状图像的数据集,该数据集包含了不同的光照、角度、表面和噪声条件,以及苹果黑星病、山茱萸苹果锈病和健康叶片的专家注释图像。这个数据集被用于训练卷积神经网络模型,以进行疾病分类,并在保留测试集上达到了97%的准确率。这个数据集的创建对于发展和部署基于机器学习的自动化植物疾病分类算法具有重要意义。
当前挑战
尽管Plant Pathology 2020 challenge dataset在疾病分类方面取得了显著的成果,但仍面临一些挑战。首先,该数据集目前只包含了三种苹果叶部疾病,需要扩展到更多种类的疾病。其次,数据集中的图像是在不同的光照、角度和表面条件下拍摄的,这增加了图像分类的难度。此外,数据集中包含了多种疾病在同一叶片上的复杂症状,这需要更先进的图像分割方法来提高分类的准确性。最后,为了实现实际应用,需要进一步提高模型在真实世界场景下的准确性和鲁棒性。
常用场景
经典使用场景
Plant Pathology 2020 challenge dataset,又称PlantVillage数据集,是由康奈尔大学的研究团队创建的,旨在通过计算机视觉技术,对苹果叶部的病害进行分类。该数据集包含了3651张高质量的苹果叶部病害图像,涵盖了苹果黑星病、苹果锈病、健康叶片等多种情况,并经过专家标注。数据集在2020年计算机视觉与模式识别会议(CVPR)的细粒度视觉分类(FGVC)研讨会上被用于“植物病理学挑战”比赛,吸引了全球超过425支队伍参赛。经典使用场景包括通过计算机视觉模型对苹果叶部病害进行自动识别和分类,以及利用深度学习算法对病害的严重程度进行量化评估。
解决学术问题
该数据集的创建解决了传统植物病理学诊断中存在的问题,如人工诊断耗时费力,易受主观因素影响,以及难以准确识别复杂病害等问题。Plant Pathology 2020 challenge dataset为研究人员提供了一个大规模、高质量的病害图像数据集,有助于推动计算机视觉技术在植物病理学领域的应用。同时,该数据集也为开发自动化植物病害诊断系统提供了重要的数据支持,有助于实现快速、准确的病害检测。
衍生相关工作
Plant Pathology 2020 challenge dataset的创建和发布,为相关研究工作提供了重要的数据支持。基于该数据集,研究人员可以开发出更加精确的病害识别模型,并对其进行性能评估。此外,该数据集还可以用于探索计算机视觉技术在植物病理学领域的更多应用,如病害严重程度的量化评估、病害发生趋势的预测等。Plant Pathology 2020 challenge dataset的发布,也为植物病理学领域的学术交流和合作提供了平台,促进了相关研究工作的开展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作