CD&S Dataset
收藏arXiv2021-10-23 更新2024-06-21 收录
下载链接:
https://osf.io/s6ru5/
下载链接
链接失效反馈官方服务:
资源简介:
CD&S数据集是由普渡大学创建的,包含4455张玉米疾病图像,用于训练深度学习模型以识别和评估玉米疾病的严重程度。该数据集包括2112张野外采集的原始图像和2343张通过背景变化增强的图像。数据集涵盖了三种常见的玉米叶部疾病:北方叶枯病、灰斑病和北方叶斑病。创建过程中,图像通过手持传感器在野外条件下采集,并通过背景移除和替换进行增强。该数据集主要应用于农业领域,旨在通过计算机视觉技术提高玉米疾病管理的效率和准确性。
The CD&S Dataset was developed by Purdue University, which contains 4,455 corn disease images for training deep learning models to identify and assess the severity of corn diseases. This dataset includes 2,112 raw images collected in the field and 2,343 images enhanced via background alteration. It covers three common corn leaf diseases: Northern Corn Leaf Blight, Gray Leaf Spot, and Northern Corn Leaf Spot. During its construction, images were captured under field conditions using handheld sensors and enhanced via background removal and replacement. Primarily applied in the agricultural domain, this dataset aims to improve the efficiency and accuracy of corn disease management through computer vision technologies.
提供机构:
普渡大学
创建时间:
2021-10-23
搜集汇总
数据集介绍

构建方式
在农业病害智能识别领域,现有数据集多采集于受控实验室环境,限制了模型在复杂田间场景下的泛化能力。CD&S数据集针对这一局限,系统构建了包含田间原始图像与增强图像的玉米病害视觉资源。其构建过程始于2020年7月,在美国普渡大学农业研究教育中心的实际农田中,使用iPhone 11 Pro的1200万像素传感器,以3000×3000像素的固定比例采集了北方叶枯病、灰斑病与北方叶斑病三类常见叶部病害的原始图像,共计2112张。为提升模型鲁棒性,研究团队进一步对半数训练图像进行边界框标注,并利用背景移除技术生成781张无背景病害叶片RGBA图像,继而通过程序化合成将其叠加于纯白与纯黑背景,最终形成包含2343张增强图像的扩充数据集。针对病害严重度评估任务,额外采集了515张北方叶斑病田间图像,依据抗性至感性连续尺度划分为五个严重等级,完善了数据集的层次结构。
使用方法
该数据集为计算机视觉与精准农业交叉研究提供了结构化数据支持。研究者可通过公开存储库获取按功能划分的六个数据文件夹,其中Dataset_Original包含全部田间原始图像,适用于图像分类模型的初步训练;Dataset_Annotated提供带边界框标注的图像与对应YOLO格式的文本文件,专用于目标检测算法的开发与性能评估。三个背景增强文件夹(黑、白、无背景)可作为数据扩充资源,在训练过程中引入以提升模型对背景干扰的鲁棒性。对于病害严重度分析任务,Dataset_Severity文件夹中的分级图像支持回归或有序分类模型的构建。在实际应用中,建议采用原始田间图像作为测试基准,以验证模型在真实场景下的泛化能力,同时可结合增强数据开展对抗性训练,从而系统性开发适用于田间移动设备的轻量化病害识别与严重度估计算法。
背景与挑战
背景概述
在农业病害智能识别领域,现有数据集多采集于受控实验室环境,限制了深度学习模型在复杂田间场景下的泛化能力。为此,普渡大学研究团队于2021年构建了CD&S数据集,专注于玉米叶部病害的识别与严重度评估。该数据集由Aanis Ahmad、Dharmendra Saraswat等学者主导开发,核心目标在于通过手持设备在真实田间条件下采集图像,并融合数据增强技术,以解决模型在自然光照、复杂背景等变量影响下的鲁棒性问题。该数据集的建立为作物病害精准管理提供了关键数据支撑,推动了农业计算机视觉从理论验证向田间应用的跨越。
当前挑战
该数据集致力于攻克两大核心挑战:在领域问题层面,传统病害识别模型受限于实验室图像与田间图像的域差异,难以应对自然环境中多变的光照条件、复杂背景干扰以及病害症状的形态多样性;在构建过程中,研究团队需克服田间图像采集的时空局限性,通过设计多背景增强策略来扩充数据规模,同时确保病害标注在叶片交叠、病灶边界模糊等情况下的精确性,并建立符合农学标准的严重度分级体系,以平衡数据多样性与标注一致性的矛盾。
常用场景
经典使用场景
在农业病害智能识别领域,CD&S数据集为玉米叶部病害的精准检测提供了关键支持。该数据集通过手持设备在田间条件下采集原始图像,并辅以多样化背景的增强图像,构建了一个包含北方叶枯病、灰斑病和北方叶斑病三类常见病害的丰富样本库。研究人员利用其标注的边界框和病害严重度分级,能够训练深度学习模型,实现病害的自动化识别与严重度评估,有效克服了传统实验室数据在田间应用中的局限性。
解决学术问题
CD&S数据集主要解决了农业病害识别研究中模型泛化能力不足的学术难题。以往基于实验室环境图像构建的数据集,如PlantVillage,虽在受控条件下表现优异,却难以适应田间复杂的光照、背景和病害形态变化。该数据集通过提供真实田间图像与增强数据,促进了鲁棒性更强的深度学习模型开发,推动了计算机视觉技术在病害管理中的实际应用,为作物保护领域的客观化、高效化研究奠定了数据基础。
实际应用
在实际农业生产中,CD&S数据集支持开发移动端或无人机搭载的病害诊断系统。农民或农技人员可通过智能手机拍摄田间玉米叶片,利用基于该数据集训练的模型实时识别病害类型并评估严重程度,从而指导精准施药与病害管理决策。这种技术不仅提升了病害监测的时效性与准确性,还降低了人工巡查的成本与主观误差,有助于实现智慧农业中的病害早期预警与可持续防控。
数据集最近研究
最新研究方向
在农业病害智能识别领域,CD&S数据集凭借其田间手持设备采集的真实图像,正推动深度学习模型向实用化迈进。该数据集聚焦玉米叶部病害的识别与严重度评估,通过结合原始田间图像与多背景增强数据,有效应对了传统实验室数据集在野外环境下的泛化局限。前沿研究围绕跨域适应性与多模态融合展开,探索模型在复杂光照、遮挡及生长阶段的稳健表现,同时结合无人机与手持传感器的协同观测,实现病害的动态监测与精准管理。这一进展不仅提升了农业病害自动诊断的可靠性,也为智慧农业的实时决策支持系统奠定了数据基础,具有显著的实践价值与学术影响。
相关研究论文
- 1CD&S Dataset: Handheld Imagery Dataset Acquired Under Field Conditions for Corn Disease Identification and Severity Estimation普渡大学 · 2021年
以上内容由遇见数据集搜集并总结生成



