anthony2261/paddy-disease-classification
收藏Hugging Face2023-12-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/anthony2261/paddy-disease-classification
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Paddy Disease Classification,主要用于水稻疾病的图像分类任务。数据集包含10种不同的水稻疾病标签(如细菌性叶枯病、细菌性叶条纹病等)和10种水稻品种标签(如ADT45、IR20等),以及水稻的年龄信息。数据集分为训练集,包含10407个样本,总大小为834127756.552字节。该数据集适用于生物学和医学领域的研究。
该数据集名为Paddy Disease Classification,主要用于水稻疾病的图像分类任务。数据集包含10种不同的水稻疾病标签(如细菌性叶枯病、细菌性叶条纹病等)和10种水稻品种标签(如ADT45、IR20等),以及水稻的年龄信息。数据集分为训练集,包含10407个样本,总大小为834127756.552字节。该数据集适用于生物学和医学领域的研究。
提供机构:
anthony2261
原始信息汇总
数据集概述
数据集信息
-
特征:
- image: 图像数据
- label: 类别标签,包括以下类别:
- 0: bacterial_leaf_blight
- 1: bacterial_leaf_streak
- 2: bacterial_panicle_blight
- 3: blast
- 4: brown_spot
- 5: dead_heart
- 6: downy_mildew
- 7: hispa
- 8: normal
- 9: tungro
- variety: 品种标签,包括以下品种:
- 0: ADT45
- 1: IR20
- 2: KarnatakaPonni
- 3: Onthanel
- 4: Ponni
- 5: Surya
- 6: Zonal
- 7: AndraPonni
- 8: AtchayaPonni
- 9: RR
- age: 整数类型,表示年龄
-
分割:
- train: 训练集,包含10407个样本,大小为834127756.552字节
-
下载大小: 816344863字节
-
数据集大小: 834127756.552字节
配置
- default:
- data_files:
- train: 路径为
data/train-*
- train: 路径为
- data_files:
任务类别
- image-classification: 图像分类任务
标签
- biology: 生物学
- medical: 医学
名称
- pretty_name: Paddy Disease Classification
大小类别
- 1K<n<10K: 样本数量在1千到1万之间
搜集汇总
数据集介绍

构建方式
在农业病害识别领域,anthony2261/paddy-disease-classification数据集通过系统化采集与标注构建而成。该数据集源自Kaggle平台的Paddy Doctor竞赛,专注于水稻病害的视觉识别。构建过程中,研究人员收集了田间真实环境下的水稻叶片图像,并依据病理学特征,由专家手动标注为十类病害状态及一类健康状态。每张图像均关联了水稻品种与植株年龄信息,确保了数据的多维性与一致性。数据以训练集单一划分形式呈现,共包含10407张图像,总计约834MB,为模型训练提供了扎实的基础。
特点
该数据集在农业图像分类中展现出鲜明的专业特性。其核心在于涵盖了十种水稻常见病害与健康状态的精细类别,包括细菌性叶枯病、稻瘟病、褐斑病等,类别定义基于明确的病理学标准。图像均附带丰富元数据,如水稻品种与植株年龄,这为研究病害与品种、生长期的关联提供了可能。数据集规模适中,图像质量统一,专注于单一作物病害,使得其在植物病理学与计算机视觉交叉领域具有高度针对性,适用于细粒度分类任务。
使用方法
针对水稻病害的智能诊断研究,本数据集提供了直接的应用路径。使用者可通过Hugging Face Datasets库加载数据,利用其预定义的图像与标签字段进行模型训练与评估。数据集适用于监督学习框架,特别是卷积神经网络等图像分类模型。在具体应用中,研究者可将图像、病害标签、品种及年龄信息结合,探索多模态或多任务学习方案,以提升病害识别的准确性与鲁棒性。数据已整合为训练集,便于直接用于模型开发与验证。
背景与挑战
背景概述
在农业信息学与植物病理学交叉领域,精准识别水稻病害对于保障全球粮食安全具有深远意义。anthony2261/paddy-disease-classification数据集应运而生,源自Kaggle平台上的Paddy Doctor竞赛,由研究社区共同构建。该数据集聚焦于水稻叶片疾病的自动化分类,涵盖细菌性叶枯病、稻瘟病、褐斑病等十类常见病害,并整合了品种与株龄信息,旨在推动计算机视觉技术在精准农业中的应用。其创建不仅为算法开发提供了标准化基准,也促进了农业病害智能诊断系统的演进,对减少农药滥用、提升作物产量具有重要实践价值。
当前挑战
该数据集致力于解决水稻病害图像分类的复杂挑战,其核心难点在于田间拍摄图像存在光照不均、背景杂乱、病害阶段多样以及类间相似性高等问题,对模型泛化能力构成严峻考验。在构建过程中,数据收集面临地域性品种差异大、病害症状随株龄动态变化等困难,需确保标注一致性与生物学准确性。此外,数据规模相对有限,且类别分布可能不均衡,这些因素均增加了开发鲁棒分类模型的难度,要求后续研究在数据增强、跨品种迁移学习等方面寻求突破。
常用场景
经典使用场景
在农业病害识别领域,anthony2261/paddy-disease-classification数据集为水稻病害的自动分类提供了关键资源。该数据集包含水稻叶片图像及对应病害标签,涵盖细菌性叶枯病、稻瘟病、褐斑病等十种常见病害类别,并附带水稻品种和植株年龄信息。研究者通常利用该数据集训练卷积神经网络等深度学习模型,实现病害特征的自动提取与分类,为精准农业中的病害监测奠定基础。
衍生相关工作
基于该数据集,研究者开展了多项经典工作。例如,改进的ResNet、EfficientNet等网络结构被用于提升病害分类准确率;部分研究结合品种和年龄信息开发多任务学习模型,增强模型泛化能力。此外,该数据集常作为基准参与Kaggle竞赛,激发了数据增强、迁移学习等方法的创新,推动了农业人工智能领域的技术发展。
数据集最近研究
最新研究方向
在农业病害智能诊断领域,anthony2261/paddy-disease-classification数据集作为水稻病害图像分类的重要资源,正推动着深度学习与精准农业的深度融合。当前研究聚焦于利用该数据集的多维特征(如病害类别、水稻品种及植株年龄)开发轻量化、高精度的卷积神经网络模型,以适配移动端或边缘计算设备在田间实时监测的需求。同时,结合迁移学习与数据增强技术,研究者致力于提升模型在复杂自然环境下的泛化能力,应对光照变化、背景干扰等挑战。该数据集的应用不仅加速了水稻病害早期预警系统的智能化进程,也为全球粮食安全与可持续农业实践提供了关键技术支持,相关成果已在Kaggle竞赛及农业信息学期刊中引发广泛关注。
以上内容由遇见数据集搜集并总结生成



