five

PlantDoc

收藏
github2020-10-01 更新2024-05-31 收录
下载链接:
https://github.com/Sana-Gupta/PlantDoc-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
PlantDoc数据集用于视觉植物病害检测,包含2,598个数据点,涵盖13种植物种类和多达17种病害类别。该数据集是通过对互联网上抓取的图像进行约300小时的人工标注得到的。使用该数据集进行模型训练,可以提高植物病害分类的准确率高达31%。

The PlantDoc dataset is designed for visual plant disease detection, comprising 2,598 data points that cover 13 plant species and up to 17 disease categories. This dataset was obtained through approximately 300 hours of manual annotation of images scraped from the internet. Utilizing this dataset for model training can enhance the accuracy of plant disease classification by up to 31%.
创建时间:
2020-07-20
原始信息汇总

数据集概述

数据集名称

PlantDoc: A Dataset for Visual Plant Disease Detection

数据集用途

用于基准测试分类模型,特别是在植物疾病检测领域的应用。

数据集内容

  • 包含2,598个数据点
  • 覆盖13种植物物种
  • 涉及多达17类疾病
  • 数据来源于互联网上抓取的图像,经过约300小时的人工标注

数据集贡献

  • 通过使用该数据集训练的模型,分类准确率可提高至多31%
  • 旨在降低计算机视觉技术在植物疾病检测领域的应用门槛

相关文献

  • 论文标题:PlantDoc: A Dataset for Visual Plant Disease Detection
  • 发表会议:ACM India Joint International Conference on Data Science and Management of Data (CoDS-COMAD 2020)
  • 论文链接:ArxivACM

数据集许可

  • 遵循Creative Commons Attribution 4.0 International许可协议
搜集汇总
数据集介绍
main_image_url
构建方式
PlantDoc数据集的构建基于互联网爬取的图像数据,涵盖了13种植物种类和17类病害。通过约300小时的人工标注工作,研究人员对这些图像进行了精细的标注,确保了数据的准确性和可靠性。该数据集共包含2,598个数据点,旨在为植物病害检测提供高质量的非实验室数据支持。
特点
PlantDoc数据集的特点在于其多样性和广泛性。它不仅涵盖了多种植物种类,还包含了多种病害类别,能够为植物病害检测提供全面的数据支持。此外,该数据集通过人工标注确保了数据的准确性,使得基于该数据集训练的模型在分类任务中表现出色,分类准确率提升了高达31%。
使用方法
PlantDoc数据集主要用于植物病害分类模型的训练和评估。研究人员可以通过该数据集学习并优化分类模型,以提高植物病害检测的准确性和效率。数据集的使用方法包括下载图像数据、加载标注信息,并通过深度学习框架进行模型训练和验证。此外,该数据集还可用于对象检测任务,进一步扩展其应用范围。
背景与挑战
背景概述
PlantDoc数据集由Davinder Singh、Naman Jain、Pranjali Jain、Pratik Kayal、Sudhakar Kumawat和Nipun Batra等研究人员于2020年创建,旨在解决植物病害检测中的视觉识别问题。该数据集包含13种植物和17类病害的2,598个数据点,通过互联网爬取的图像并经过约300小时的人工标注完成。PlantDoc的提出背景源于印度每年因植物病害导致的35%农作物损失,而早期检测的困难主要在于缺乏实验室基础设施和专业知识。该数据集在ACM印度联合国际数据科学与数据管理会议(CoDS-COMAD 2020)上发布,为计算机视觉技术在植物病害检测中的应用提供了重要的基准数据支持。
当前挑战
PlantDoc数据集在解决植物病害视觉检测问题时面临多重挑战。首先,植物病害的多样性和复杂性使得图像分类任务具有较高的难度,尤其是在病害早期阶段,症状可能不明显或与其他环境因素混淆。其次,数据集的构建过程中,研究人员需要从互联网上爬取大量图像并进行人工标注,这一过程不仅耗时,还面临图像质量参差不齐、标注一致性难以保证等问题。此外,由于植物病害的分布具有地域性和季节性,数据集的多样性和代表性也受到限制,可能影响模型的泛化能力。这些挑战为后续研究提供了改进方向,例如通过数据增强和多模态融合技术提升模型的鲁棒性。
常用场景
经典使用场景
PlantDoc数据集在植物病害检测领域具有广泛的应用,尤其是在计算机视觉技术的支持下,该数据集被用于训练和评估图像分类模型。通过提供大量标注的植物病害图像,PlantDoc使得研究人员能够开发出高效的分类算法,从而实现对植物病害的自动识别和分类。这一数据集的使用场景主要集中在农业科技领域,特别是在缺乏实验室基础设施和专家资源的地区,PlantDoc为植物病害的早期检测提供了可行的解决方案。
解决学术问题
PlantDoc数据集解决了植物病害检测领域中的一个关键问题,即缺乏大规模的非实验室数据集。通过提供包含13种植物和17种病害类别的2598个数据点,该数据集显著提升了植物病害分类模型的准确性,最高可提高31%。这一成果不仅推动了计算机视觉技术在农业中的应用,还为全球范围内的农作物保护提供了新的研究工具,尤其是在资源有限的地区,PlantDoc为植物病害的早期诊断和防治提供了科学依据。
衍生相关工作
PlantDoc数据集的发布催生了一系列相关研究工作,特别是在植物病害检测和分类领域。许多研究团队基于该数据集开发了新的深度学习模型,进一步提升了分类精度和检测效率。此外,PlantDoc还激发了跨学科合作,推动了计算机视觉技术与农业科学的深度融合。一些衍生工作还探索了如何将PlantDoc与其他农业数据集结合,以构建更全面的植物健康监测系统,为全球农业可持续发展提供了新的研究方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作