five

PlantVillage-Dataset

收藏
github2024-05-05 更新2024-05-31 收录
下载链接:
https://github.com/gabrieldgf4/PlantVillage-Dataset
下载链接
链接失效反馈
官方服务:
更多采购需求
资源简介:
PlantVillage数据集包含54,304张图像,涵盖14种作物:苹果、蓝莓、樱桃、玉米、葡萄、橙子、桃子、甜椒、土豆、覆盆子、大豆、南瓜、草莓、番茄。数据集包括17种真菌病害、4种细菌病害、2种霉菌(卵菌)病害、2种病毒病害和1种由螨虫引起的病害。此外,12种作物还包括健康叶片的图像,这些叶片未受疾病明显影响。

The PlantVillage dataset comprises 54,304 images, encompassing 14 types of crops: apple, blueberry, cherry, corn, grape, orange, peach, bell pepper, potato, raspberry, soybean, squash, strawberry, and tomato. The dataset includes 17 types of fungal diseases, 4 bacterial diseases, 2 mold (oomycete) diseases, 2 viral diseases, and 1 disease caused by mites. Additionally, images of healthy leaves, which are not significantly affected by diseases, are also included for 12 of these crops.
创建时间:
2020-04-08
原始信息汇总

PlantVillage-Dataset 概述

数据集内容

  • 图像数量: 54,304张
  • 涉及作物种类: 14种,包括苹果、蓝莓、樱桃、玉米、葡萄、橙子、桃子、甜椒、土豆、覆盆子、大豆、南瓜、草莓、番茄。
  • 疾病类型:
    • 17种真菌病
    • 4种细菌病
    • 2种霉菌病(卵菌病)
    • 2种病毒病
    • 1种由螨引起的病害
  • 健康叶片图像: 12种作物包含无病害的健康叶片图像

数据集处理

  • 原始数据库已不可用,当前数据集为从另一GitHub账户复制并重新发布。
  • 从健康叶片目录中移除了5张不符合特征的图像,并单独存放于名为"x_Removed_from_Healthy_leaves"的目录中。

数据集下载

  • 可通过以下命令下载数据集:

    git clone https://github.com/gabrieldgf4/PlantVillage-Dataset.git cd PlantVillage-Dataset

搜集汇总
数据集介绍
main_image_url
构建方式
PlantVillage-Dataset的构建基于对14种作物物种的广泛图像采集,涵盖了苹果、蓝莓、樱桃、玉米、葡萄、橙子、桃子、甜椒、土豆、覆盆子、大豆、南瓜、草莓和番茄。该数据集不仅包括17种真菌病害、4种细菌病害、2种霉菌病害、2种病毒病害以及1种由螨虫引起的病害的图像,还特别收录了12种作物的健康叶片图像。值得注意的是,原始数据库已不再在PlantVillage网站上提供,因此数据集的维护者从另一个GitHub账户获取了副本并重新发布。此外,为了确保数据质量,从健康叶片目录中移除了五张不符合特征的图像,并将其单独存放于'x_Removed_from_Healthy_leaves'目录中。
特点
PlantVillage-Dataset的显著特点在于其广泛性和多样性。该数据集包含了54,304张图像,不仅覆盖了多种作物和病害类型,还特别区分了健康与受病害影响的叶片图像,为研究者提供了丰富的对比材料。此外,数据集的构建过程中对图像质量进行了严格筛选,确保了数据的高标准和可靠性。这种细致的分类和质量控制使得该数据集在植物病害诊断和机器学习模型的训练中具有极高的应用价值。
使用方法
使用PlantVillage-Dataset时,用户可以通过Git命令直接克隆数据集的GitHub仓库,进入目录后即可访问所有图像数据。该数据集适用于多种研究场景,包括但不限于植物病害的自动检测、图像分类模型的训练以及机器学习算法的效果评估。由于数据集的广泛性和高质量,它特别适合于需要大量标注数据的研究项目。用户可以根据具体需求,选择合适的图像子集进行分析和模型训练,从而提高研究效率和准确性。
背景与挑战
背景概述
PlantVillage-Dataset,由David P. Hughes和Marcel Salathé于2015年创建,是一个包含54,304张图像的开源数据集,旨在支持基于机器学习和众包的移动疾病诊断工具的开发。该数据集涵盖了14种作物,包括苹果、蓝莓、樱桃等,以及17种真菌病害、4种细菌病害、2种霉菌病害、2种病毒病害和1种由螨虫引起的病害。此外,12种作物还包括健康叶片的图像。PlantVillage-Dataset的发布极大地推动了农业领域中植物病害识别技术的研究,为研究人员提供了丰富的图像资源,促进了相关算法的开发与优化。
当前挑战
尽管PlantVillage-Dataset在植物病害识别领域具有重要意义,但其构建过程中仍面临诸多挑战。首先,数据集的原始图像数据库已不再可用,研究人员需从其他来源获取并重新发布。其次,数据清理过程中发现部分健康叶片的图像不符合特征要求,需单独处理,增加了数据管理的复杂性。此外,数据集的多样性和规模要求高效的图像处理和分类算法,以确保准确识别各种病害。这些挑战不仅影响了数据集的可用性,也对后续研究提出了更高的技术要求。
常用场景
经典使用场景
在农业科技领域,PlantVillage-Dataset以其丰富的图像资源和多样的植物病害分类,成为机器学习和计算机视觉研究中的经典数据集。研究者们常利用此数据集训练深度学习模型,以实现对植物病害的自动检测和分类。通过分析不同植物种类及其病害的图像特征,模型能够准确识别出受感染的植物部位,从而为农业生产提供及时的病害预警和防治建议。
解决学术问题
PlantVillage-Dataset在学术研究中解决了植物病害自动检测与分类的关键问题。传统的植物病害识别依赖于专家经验和实验室检测,耗时且成本高。该数据集通过提供大规模、多样化的植物病害图像,使得机器学习算法能够在大数据支持下进行高效训练,显著提升了病害识别的准确性和效率。这不仅推动了农业科技的发展,也为相关领域的研究提供了宝贵的数据资源。
衍生相关工作
基于PlantVillage-Dataset,许多研究者开展了进一步的工作,推动了农业科技的进步。例如,有研究利用该数据集开发了基于卷积神经网络(CNN)的植物病害识别模型,显著提高了病害分类的准确率。此外,还有研究结合迁移学习和数据增强技术,优化了模型在不同环境下的适应性。这些衍生工作不仅丰富了数据集的应用场景,也为农业智能化提供了新的技术路径。
以上内容由遇见数据集搜集并总结生成

社区讨论

【我遇到的问题】 • 现象:该数据集的下载链接已失效 【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作