five

COT-AD: COTTON ANALYSIS DATASET

收藏
arXiv2025-07-24 更新2025-07-26 收录
下载链接:
https://aamaanakbar.github.io/COT-AD/
下载链接
链接失效反馈
官方服务:
资源简介:
COT-AD数据集是一个全面的棉花作物分析数据集,旨在通过计算机视觉技术提升棉花作物分析。该数据集包含超过25,000张图像,涵盖了整个棉花生长周期的各个阶段,其中包括5,000张带注释的图像。COT-AD数据集包括用于田地规模检测和分割的航拍图像,以及记录关键病害的高分辨率DSLR图像。注释包括害虫和病害识别、植被和杂草分析,填补了棉花特定农业数据集的关键空白。COT-AD支持分类、分割、图像恢复、增强、基于深度生成模型的棉花作物合成和早期病害管理等任务,推动数据驱动的作物管理。

The COT-AD dataset is a comprehensive cotton crop analysis dataset aimed at enhancing cotton crop analysis through computer vision technologies. This dataset contains over 25,000 images covering all stages of the entire cotton growth cycle, including 5,000 annotated images. The COT-AD dataset includes aerial images for field-scale detection and segmentation, as well as high-resolution DSLR images that document key cotton diseases. Its annotations cover pest and disease identification, vegetation and weed analysis, filling critical gaps in cotton-specific agricultural datasets. The COT-AD dataset supports tasks such as classification, segmentation, image restoration, image enhancement, synthetic generation of cotton crops based on deep generative models, and early disease management, promoting data-driven crop management.
提供机构:
印度理工学院甘地讷格尔分校, 印度
创建时间:
2025-07-24
原始信息汇总

COT-AD: COTTON ANALYSIS DATASET 概述

基本信息

  • 数据集名称: COT-AD (COTTON ANALYSIS DATASET)
  • 作者: Akbar Ali, Mahek Vyas, Soumyaratna Debnath, Chanda Grover Kamra, Jaidev Sanjay Khalane, Reuben Shibu Devanesan, Indra Deep Mastan, Subramanian Sankaranarayanan, Pankaj Khanna, Shanmuganathan Raman
  • 发表会议: ICIP 2025
  • 机构:
    • Indian Institute Of Technology Gandhinagar, India
    • Larsen & Toubro Technology Services Limited, India
    • Ashoka University - Sonipat, India
    • Indian Institute of Technology (BHU) Varanasi, India
  • 数据集链接:

数据集摘要

  • 目的: 通过计算机视觉增强棉花作物分析。
  • 内容:
    • 超过25,000张棉花生长周期图像,其中5,000张标注图像。
    • 包含用于田间检测和分割的航空影像,以及记录关键病害的高分辨率DSLR图像。
  • 标注内容: 害虫和病害识别、植被和杂草分析。
  • 支持任务: 分类、分割、图像恢复与增强、基于深度生成模型的棉花作物合成、早期病害管理。

数据集结构

标注数据

  1. 航空影像(检测与分割):

    • 时间跨度: 6个月,分为4部分(Part A-D)。
    • 每部分包含:
      • Images: 棉花作物的航空JPG图像。
      • Detection Labels: YOLO格式的.txt文件(单类检测)。
      • Segmentation Masks: 二值JPG分割掩码。
      • Segmentation Labels: YOLO格式的分割标签文件。
  2. 高分辨率DSLR影像(棉花作物健康分析):

    • 叶片病害:
      • 黄叶
      • 叶斑病细菌性枯萎病
      • 红叶病
      • 健康叶片
    • 棉铃:
      • 棉铃腐烂
      • 受损棉铃
      • 健康棉铃
    • 害虫:
      • 粉蚧
      • 红棉蝽

未标注数据

  1. DSLR数据(按周采集):

    • 高分辨率特写图像(叶片、棉铃、害虫)。
    • 包含用于时间分析的视频。
  2. Farm_2(双周采集):

    • 无人机影像(10m、15m、115m高度)。
    • 用途: 植物发育、病害检测、环境监测。
  3. Farm_1(每周采集):

    • 无人机影像(10m、15m、115m高度)。
    • 用途: 时间序列分析、作物生长跟踪、异常检测。

应用领域

  • 农业技术
  • 棉花作物监测
  • 病害检测
  • 计算机视觉与图像处理
  • 精准农业

引用格式

bibtex @misc{ali2025cotad, title={COT-AD: Cotton Analysis Dataset}, author={Akbar Ali and Mahek Vyas and Soumyaratna Debnath and Chanda Grover Kamra and Jaidev Sanjay Khalane and Reuben Shibu Devanesan and Indra Deep Mastan and Subramanian Sankaranarayanan and Pankaj Khanna and Shanmuganathan Raman}, year={2025}, eprint={2507.18532}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={http://arxiv.org/abs/2507.18532} }

搜集汇总
数据集介绍
main_image_url
构建方式
在精准农业和计算机视觉技术迅猛发展的背景下,COT-AD数据集通过系统化采集与标注流程构建而成。研究团队采用DJI Mavic Air 2无人机以10米、15米和115米三种航拍高度,历时六个月对两处棉花种植区进行周期性航拍监测,同步使用佳能EOS 80D DSLR相机每周两次采集近景图像。数据采集覆盖棉花完整生长周期,包含25,000余幅图像及140段视频,其中5,000幅经农学专家人工标注形成多任务标注体系,涵盖病虫害识别、植被分析和杂草检测等关键维度。数据集采用分层存储架构,按时间阶段和任务类型组织航拍检测标注与DSLR疾病分类数据,确保数据结构的科学性与可用性。
特点
作为当前最全面的棉花作物视觉分析数据集,COT-AD具有三大核心特征:多模态数据融合性同时包含宏观航拍与微观近景图像,航拍影像提供10-115米多尺度农田观测视角,DSLR图像则达到像素级病害特征呈现;时序完整性完整记录棉花播种至收获各生长阶段,特别包含病虫害自然发展过程的珍贵影像;任务多样性支持分类、检测、分割、图像增强与合成等六类计算机视觉任务,其中病害分类细分为9种子类,检测标注符合YOLO标准。相比现有同类数据集,其样本量提升6倍且分辨率最高达5472×3648像素,填补了棉花作物多任务联合分析的空白。
使用方法
该数据集支持端到端的农业智能研究流程:基础任务层可直接加载YOLO格式标注进行目标检测训练,或利用PIL库读取JPG分割掩膜开展语义分割实验;进阶应用层提供StyleGAN2-ADA预训练权重支持图像合成任务,配套的CLIP-RC多模态模型可实现零样本分类。研究者可通过Kaggle或IEEE DataPort平台获取310GB原始数据,按目录结构加载特定生长阶段或任务类型子集。典型工作流包括:使用PyTorch加载DSLR疾病子集训练VGG19分类器(测试准确率83.37%),或基于SAM模型对航拍图像实施棉花植株实例分割。数据集遵循CC BY-NC 4.0许可,要求非商业使用且需引用原始论文。
背景与挑战
背景概述
COT-AD(Cotton Analysis Dataset)是由印度理工学院甘地讷格尔分校等机构的研究团队于2025年推出的棉花作物分析专用数据集。作为全球首个覆盖棉花完整生长周期的多模态农业数据集,它填补了棉花特异性计算机视觉研究的空白。该数据集包含25,000余幅无人机航拍图像和高清DSLR特写图像,涵盖9类主要病虫害特征,并附带精细标注,支持分类、检测、分割、图像增强等五大核心任务。其创新性在于融合了宏观田间尺度与微观病理特征,为精准农业中的棉花生长监测、早期病害预警和产量预测提供了关键数据支撑,对推动农业AI技术在发展中国家棉花主产区的应用具有里程碑意义。
当前挑战
在领域问题层面,COT-AD需解决三大挑战:1) 棉花病虫害的细粒度识别难题,特别是叶片红化病与细菌性角斑病等视觉相似病害的区分;2) 多生长阶段作物特征的动态变化建模,涉及从幼苗期到收获期长达6个月的形态演化;3) 复杂农田环境下作物与杂草的语义分割,需克服光照变化和植被遮挡问题。在构建过程中,研究团队面临无人机航拍数据的大规模标注一致性维护、DSLR图像病理特征的专家验证耗时、以及跨海拔(10-115米)影像的尺度归一化等技术挑战,最终通过建立三级质量校验流程和自适应标注策略予以解决。
常用场景
经典使用场景
在精准农业领域,COT-AD数据集通过融合无人机航拍与DSLR近景图像,为棉花作物全生长周期监测提供了多尺度分析框架。其25,000余张标注图像支持从田间尺度病虫害分布映射到单株叶片病斑识别的跨层级研究,尤其在棉铃虫害早期识别与叶面病斑分类任务中展现出显著优势。数据集独特的双模态特性(10-115米航拍与微距拍摄)为计算机视觉算法提供了测试跨分辨率泛化能力的基准平台。
衍生相关工作
该数据集已催生多个标志性研究成果:在图像增强领域,AesPA-Net方法利用其DSLR子集实现美学模式感知的风格迁移(Arniqa评分0.65);语义分割方面,CLIP-RC模型通过跨模态学习在棉田杂草分割任务达到89.2% mIoU;病害分类中,BioCLIP框架基于该数据集的迁移学习使少样本识别准确率提升21.8%。相关成果发表在CVPR、ICCV等顶会,并衍生出棉花铃数统计、多光谱融合等7个延伸研究方向。
数据集最近研究
最新研究方向
随着精准农业和计算机视觉技术的快速发展,COT-AD数据集在棉花作物分析领域展现出广阔的应用前景。该数据集通过整合无人机航拍图像和高分辨率DSLR图像,为棉花生长周期监测、病虫害识别及杂草分析提供了全面的视觉数据支持。当前研究热点集中在基于深度学习的多任务协同分析,包括利用生成对抗网络进行棉花作物合成图像生成,以及结合文本引导的图像增强技术提升病害识别精度。在农业智能化背景下,该数据集通过支持早期病害预警系统和精准施药决策,显著提升了棉花种植的经济效益和可持续性。其多模态数据特性也为跨领域研究如农业遥感与计算机视觉的融合创新提供了重要基础。
相关研究论文
  • 1
    COT-AD: Cotton Analysis Dataset印度理工学院甘地讷格尔分校, 印度 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作