GVJahnavi/Plant_village_subset
收藏Hugging Face2024-03-20 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/GVJahnavi/Plant_village_subset
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: label
dtype:
class_label:
names:
'0': Apple__Apple_scab
'1': Apple__Black_rot
'2': Apple__Cedar_apple_rust
'3': Apple___healthy
'4': Blueberry___healthy
'5': Cherry_(including_sour)___Powdery_mildew
'6': Cherry_(including_sour)___healthy
'7': Corn_(maize)___Cercospora_leaf_spot Gray_leaf_spot
'8': Corn_(maize)___Common_rust_
'9': Corn_(maize)___Northern_Leaf_Blight
'10': Corn_(maize)___healthy
'11': Grape___Black_rot
'12': Grape___Esca_(Black_Measles)
'13': Grape___Leaf_blight_(Isariopsis_Leaf_Spot)
'14': Grape___healthy
splits:
- name: train
num_bytes: 183540951.55
num_examples: 11322
- name: test
num_bytes: 45176971.724
num_examples: 2916
download_size: 219374135
dataset_size: 228717923.27400002
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征:
- 名称:图像(image),数据类型:图像
- 名称:标签(label),数据类型:分类标签(class_label),类别映射关系如下:
'0': 苹果——苹果疮痂病(Apple__Apple_scab)
'1': 苹果——黑腐病(Apple__Black_rot)
'2': 苹果——雪松苹果锈病(Apple__Cedar_apple_rust)
'3': 苹果——健康个体(Apple___healthy)
'4': 蓝莓——健康个体(Blueberry___healthy)
'5': 樱桃(含酸樱桃)——白粉病(Cherry_(including_sour)___Powdery_mildew)
'6': 樱桃(含酸樱桃)——健康个体(Cherry_(including_sour)___healthy)
'7': 玉米(maize)——尾孢叶斑病(灰斑病)(Corn_(maize)___Cercospora_leaf_spot Gray_leaf_spot)
'8': 玉米(maize)——普通锈病(Corn_(maize)___Common_rust_)
'9': 玉米(maize)——北方叶枯病(Corn_(maize)___Northern_Leaf_Blight)
'10': 玉米(maize)——健康个体(Corn_(maize)___healthy)
'11': 葡萄——黑腐病(Grape___Black_rot)
'12': 葡萄——埃斯卡病(黑麻疹)(Grape___Esca_(Black_Measles))
'13': 葡萄——叶枯病(伊萨里孢叶斑病)(Grape___Leaf_blight_(Isariopsis_Leaf_Spot))
'14': 葡萄——健康个体(Grape___healthy)
数据集划分:
- 划分名称:训练集(train),数据字节数:183540951.55,样本数:11322
- 划分名称:测试集(test),数据字节数:45176971.724,样本数:2916
下载总大小:219374135 字节,数据集总大小:228717923.27400002 字节
数据集配置:
- 配置名称:默认配置(default),数据文件路径:
- 训练集划分:对应路径 data/train-*
- 测试集划分:对应路径 data/test-*
提供机构:
GVJahnavi
原始信息汇总
数据集概述
数据特征
- 图像:
- 名称:image
- 数据类型:image
- 标签:
- 名称:label
- 数据类型:class_label
- 类别名称:
- 0: Apple__Apple_scab
- 1: Apple__Black_rot
- 2: Apple__Cedar_apple_rust
- 3: Apple___healthy
- 4: Blueberry___healthy
- 5: Cherry_(including_sour)___Powdery_mildew
- 6: Cherry_(including_sour)___healthy
- 7: Corn_(maize)___Cercospora_leaf_spot Gray_leaf_spot
- 8: Corn_(maize)__Common_rust
- 9: Corn_(maize)___Northern_Leaf_Blight
- 10: Corn_(maize)___healthy
- 11: Grape___Black_rot
- 12: Grape___Esca_(Black_Measles)
- 13: Grape___Leaf_blight_(Isariopsis_Leaf_Spot)
- 14: Grape___healthy
数据分割
- 训练集:
- 名称:train
- 字节数:183540951.55
- 样本数:11322
- 测试集:
- 名称:test
- 字节数:45176971.724
- 样本数:2916
数据集大小
- 下载大小:219374135
- 数据集大小:228717923.27400002
配置
- 默认配置:
- 配置名称:default
- 数据文件:
- 训练集路径:data/train-*
- 测试集路径:data/test-*
搜集汇总
数据集介绍

构建方式
在农业病害识别领域,高质量图像数据集的构建对于推动植物健康监测技术的发展至关重要。GVJahnavi/Plant_village_subset数据集源自经典的PlantVillage公开资源,通过精心筛选与整理,聚焦于苹果、蓝莓、樱桃、玉米和葡萄等关键作物的病害与健康状态。其构建过程遵循标准化流程,原始图像经过统一预处理,划分为训练集与测试集,确保数据的一致性与可重复性。该子集涵盖了15个类别,包括多种常见病害与健康样本,为模型训练提供了均衡且具有代表性的视觉数据基础。
特点
该数据集的核心特点在于其高度的专业性与结构化设计。图像内容清晰展示了作物叶片的病害症状与健康形态,每张图像均标注了精确的类别标签,涵盖苹果黑星病、玉米普通锈病、葡萄黑腐病等典型病理特征。数据规模适中,包含超过1.1万张训练图像与约2900张测试图像,兼顾了模型训练的充分性与评估的可靠性。类别分布涵盖了多种作物,实现了跨物种的病害表征,为农业图像分类研究提供了多类别、细粒度的视觉基准。
使用方法
在农业人工智能应用中,该数据集可直接用于监督学习框架下的图像分类任务。研究人员可使用标准深度学习流程加载数据,利用训练集进行模型训练,并通过测试集评估模型在未见数据上的泛化性能。数据集已预先分割为训练与测试部分,支持即插即用的实验设置。典型应用包括构建卷积神经网络或视觉Transformer模型,实现作物病害的自动诊断,为精准农业中的早期病害检测提供算法支持。
背景与挑战
背景概述
植物病害识别是农业信息学与计算机视觉交叉领域的关键研究方向,旨在通过自动化技术提升作物健康监测效率。PlantVillage数据集由宾夕法尼亚州立大学等机构于2016年构建,汇集了多种农作物在自然光照条件下的叶片图像,涵盖健康与病害状态。该数据集的核心研究问题在于解决传统农业依赖人工目视检查的局限性,通过大规模标注图像推动深度学习模型在病害分类任务中的应用,为精准农业和可持续粮食生产提供了重要的数据基础。
当前挑战
植物病害识别面临多重挑战:在领域问题层面,不同病害在视觉特征上存在高度相似性,如锈病与霉斑的形态重叠,增加了模型区分的难度;同时,田间环境的光照变化、叶片姿态多样性以及背景干扰要求模型具备强大的鲁棒性。在数据构建过程中,采集涵盖全球不同地域、生长阶段的病害样本需要协调多方农业机构,确保图像标注的准确性依赖植物病理学专家的深度参与,而类别不平衡问题——健康样本远多于特定病害样本——亦对模型训练提出了均衡性挑战。
常用场景
经典使用场景
在植物病理学与计算机视觉交叉领域,PlantVillage子集作为经典基准数据集,广泛用于训练和评估深度学习模型对农作物叶片病害的自动识别能力。该数据集通过高质量图像标注,支持卷积神经网络等模型学习多种作物病害的视觉特征,如苹果黑星病、玉米锈病等,为农业智能化诊断提供了标准化测试平台。
解决学术问题
该数据集有效解决了农业领域中病害识别依赖人工经验、效率低下的学术难题。通过提供大规模标注图像,它支持研究者开发高精度分类模型,推动迁移学习、小样本学习等前沿方法在植物病害检测中的应用,显著提升了病害识别的自动化水平与泛化能力,对智慧农业研究具有重要理论意义。
衍生相关工作
基于该数据集,衍生出诸多经典研究工作,如使用ResNet、EfficientNet等架构进行病害分类优化,以及结合生成对抗网络的数据增强策略以应对类别不平衡问题。部分研究进一步探索多任务学习框架,同时识别病害种类与严重程度,推动了农业人工智能向细粒度分析方向发展。
以上内容由遇见数据集搜集并总结生成



