five

PlantVillage Dataset|植物疾病识别数据集|图像分类数据集

收藏
github2024-09-26 更新2024-09-27 收录
植物疾病识别
图像分类
下载链接:
https://github.com/aezamsos/Plant-Disease-Monitoring-Expert-with-Supplements
下载链接
链接失效反馈
资源简介:
该数据集包含约54,305张植物叶子的图像,这些图像在受控环境下收集,涵盖14种不同的植物种类。数据集包含38种植物疾病类别和1种背景图像。
创建时间:
2024-09-26
原始信息汇总

Plant-Disease-Monitoring-Expert-with-Supplements

数据集概述

  • 数据集名称: PlantVillage Dataset
  • 数据集来源: crowdAI 在 PlantVillage Disease Classification Challenge 中发布
  • 数据集规模: 约 54,305 张植物叶片图像
  • 植物种类: 14 种
    • Apple
    • Blueberry
    • Cherry
    • Corn
    • Grape
    • Orange
    • Peach
    • Bell Pepper
    • Potato
    • Raspberry
    • Soybean
    • Squash
    • Strawberry
    • Tomato
  • 疾病类别: 38 种植物疾病 + 1 种背景图像

疾病类别列表

  1. Apple Scab
  2. Apple Black Rot
  3. Apple Cedar Rust
  4. Apple Healthy
  5. Blueberry Healthy
  6. Cherry Healthy
  7. Cherry Powdery Mildew
  8. Corn Gray Leaf Spot
  9. Corn Common Rust
  10. Corn Healthy
  11. Corn Northern Leaf Blight
  12. Grape Black Rot
  13. Grape Black Measles
  14. Grape Leaf Blight
  15. Grape Healthy
  16. Orange Huanglongbing
  17. Peach Bacterial Spot
  18. Peach Healthy
  19. Bell Pepper Bacterial Spot
  20. Bell Pepper Healthy
  21. Potato Early Blight
  22. Potato Healthy
  23. Potato Late Blight
  24. Raspberry Healthy
  25. Soybean Healthy
  26. Squash Powdery Mildew
  27. Strawberry Healthy
  28. Strawberry Leaf Scorch
  29. Tomato Bacterial Spot
  30. Tomato Early Blight
  31. Tomato Late Blight
  32. Tomato Leaf Mold
  33. Tomato Septoria Leaf Spot
  34. Tomato Two Spotted Spider Mite
  35. Tomato Target Spot
  36. Tomato Mosaic Virus
  37. Tomato Yellow Leaf Curl Virus
  38. Tomato Healthy
AI搜集汇总
数据集介绍
main_image_url
构建方式
PlantVillage数据集的构建基于对植物叶片的图像采集,这些图像在受控的环境条件下拍摄,涵盖了14种不同的植物种类。数据集包含了大约54,305张图像,分为38种植物病害类别和1种背景图像类别。这些图像的收集和分类工作由crowdAI在PlantVillage Disease Classification Challenge期间完成,确保了数据集的广泛性和代表性。
特点
PlantVillage数据集的特点在于其多样性和广泛性。它不仅包含了多种植物种类,还详细区分了各种植物病害,为研究者提供了丰富的数据资源。此外,数据集的图像质量高,拍摄条件一致,有助于提高模型训练的准确性和可靠性。
使用方法
使用PlantVillage数据集时,研究者可以利用这些图像进行植物病害的分类和检测模型的训练。由于数据集的规模较大,建议使用具有较强计算能力的平台,如Google Colab,以加速模型训练过程。研究者可以通过加载数据集,进行数据预处理,然后使用机器学习或深度学习算法进行模型训练和评估。
背景与挑战
背景概述
随着环境变化对植物的负面影响日益加剧,农业产量显著下降,这不仅源于肥料和农药的过度使用,还对依赖农业的经济体造成了深远影响。在此背景下,PlantVillage Dataset应运而生,该数据集由crowdAI在PlantVillage Disease Classification Challenge期间发布,旨在通过图像识别技术实现植物疾病的早期检测。该数据集包含了约54,305张在受控环境下采集的植物叶片图像,涵盖14种不同植物种类和38种植物疾病类别,以及1种背景图像。这一数据集的创建,标志着现代农业中植物疾病检测技术的重要进步,为农民提供了早期干预的可能性,从而保障了农作物的质量和产量。
当前挑战
尽管PlantVillage Dataset在植物疾病检测领域具有重要意义,但其构建和应用过程中仍面临诸多挑战。首先,数据集的规模庞大,包含超过5万张图像,这使得在标准机器上进行本地模型训练变得极为困难,需要借助如Google Colab等平台的高性能计算资源。其次,数据集中的图像采集于受控环境,这可能限制了其在实际农业环境中的泛化能力,因为自然环境中的光照、湿度等因素可能显著影响图像识别的准确性。此外,数据集中包含的植物种类和疾病种类繁多,如何有效分类和识别这些多样化的图像,也是当前研究面临的一大挑战。
常用场景
经典使用场景
在现代农业领域,PlantVillage Dataset的经典应用场景主要集中在植物病害的自动检测与分类。通过分析智能手机或专用摄像头捕获的植物叶片图像,该数据集支持构建高效的机器学习模型,以识别出多种植物病害的早期症状。这种自动化系统不仅提高了病害检测的准确性和效率,还为农民提供了及时的防治建议,从而显著提升了农作物的健康状况和产量。
解决学术问题
PlantVillage Dataset在学术研究中解决了植物病害早期检测的关键问题。通过提供大量高质量的植物叶片图像,该数据集为研究人员提供了丰富的数据资源,促进了图像识别和机器学习算法在植物病害检测领域的应用和发展。这不仅推动了农业科技的进步,还为实现可持续农业提供了重要的技术支持,具有深远的学术意义和实际影响。
衍生相关工作
基于PlantVillage Dataset,许多相关研究工作得以展开,推动了植物病害检测技术的创新。例如,一些研究团队利用该数据集开发了深度学习模型,显著提高了病害识别的准确率;另一些研究则探索了多模态数据融合的方法,以增强系统的鲁棒性和泛化能力。这些衍生工作不仅丰富了数据集的应用场景,还为农业科技的进一步发展提供了新的思路和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

FAOSTAT Agricultural Data

FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。

www.fao.org 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录