KaraAgroAI/CADI-AI
收藏Hugging Face2023-06-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/KaraAgroAI/CADI-AI
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-sa-4.0
task_categories:
- object-detection
language:
- en
tags:
- object detection
- vision
size_categories:
- 1K<n<10K
extra_gated_heading: "Acknowledge license to accept the repository"
extra_gated_button_content: "Acknowledge license"
extra_gated_fields:
I agree to attribute the creator of this repository: checkbox
---
---
## Cashew Disease Identication with Artificial Intelligence (CADI-AI) Dataset
This repository contains a comprehensive dataset of cashew images captured by drones, accompanied by meticulously annotated labels.
Each high-resolution image in the dataset has a resolution of 1600x1300 pixels, providing fine details for analysis and model training.
To facilitate efficient object detection, each image is paired with a corresponding text file in YOLO format.
The YOLO format file contains annotations, including class labels and bounding box coordinates.
### Dataset Labels
```
['abiotic', 'insect', 'disease']
```
### Number of Images
```json
{'train': 3788, 'valid': 710, 'test': 238}
```
### Number of Instances Annotated
```json
{'insect':1618, 'abiotic':13960, 'disease':7032}
```
### Folder structure after unzipping repective folders
```markdown
Data/
└── train/
├── images
├── labels
└── val/
├── images
├── labels
└── test/
├── images
├── labels
```
### Dataset Information
The dataset was created by a team of data scientists from the KaraAgro AI Foundation,
with support from agricultural scientists and officers.
The creation of this dataset was made possible through funding of the
Deutsche Gesellschaft für Internationale Zusammenarbeit (GIZ) through their projects
[Market-Oriented Value Chains for Jobs & Growth in the ECOWAS Region (MOVE)](https://www.giz.de/en/worldwide/108524.html) and
[FAIR Forward - Artificial Intelligence for All](https://www.bmz-digital.global/en/overview-of-initiatives/fair-forward/), which GIZ implements on
behalf the German Federal Ministry for Economic Cooperation and Development (BMZ).
For detailed information regarding the dataset, we invite you to explore the accompanying datasheet available [here](https://drive.google.com/file/d/1viv-PtZC_j9S_K1mPl4R1lFRKxoFlR_M/view?usp=sharing).
This comprehensive resource offers a deeper understanding of the dataset's composition, variables, data collection methodologies, and other relevant details.
提供机构:
KaraAgroAI
原始信息汇总
数据集概述
数据集名称
Cashew Disease Identication with Artificial Intelligence (CADI-AI) Dataset
数据集描述
该数据集包含由无人机捕获的腰果图像,并附有精心标注的标签。每个图像的分辨率为1600x1300像素,提供详细的分析和模型训练所需的高分辨率图像。每个图像都配有一个对应的YOLO格式文本文件,包含类别标签和边界框坐标,以促进有效的目标检测。
数据集标签
[abiotic, insect, disease]
图像数量
json {train: 3788, valid: 710, test: 238}
标注实例数量
json {insect:1618, abiotic:13960, disease:7032}
文件夹结构
Data/
└── train/
├── images
├── labels
└── val/
├── images
├── labels
└── test/
├── images
├── labels
数据集创建
该数据集由KaraAgro AI Foundation的数据科学家团队创建,得到了农业科学家和官员的支持。数据集的创建得到了德国国际合作机构(GIZ)通过其项目Market-Oriented Value Chains for Jobs & Growth in the ECOWAS Region (MOVE)和FAIR Forward - Artificial Intelligence for All的资助,GIZ代表德国联邦经济合作与发展部(BMZ)实施这些项目。
搜集汇总
数据集介绍

构建方式
在精准农业与植物病理学交叉领域,CADI-AI数据集的构建体现了多学科协作的严谨性。该数据集由KaraAgro AI基金会的数据科学家团队主导,在农业科学家与官员的支持下,并依托德国国际合作机构(GIZ)及其相关项目的资助完成。数据采集通过无人机航拍技术获取,确保了图像的高分辨率与覆盖广度。每张1600x1300像素的图像均配有采用YOLO格式的精细标注文件,标注过程严格遵循标准,最终形成了包含训练集3788张、验证集710张及测试集238张的完整结构。
特点
CADI-AI数据集的核心特点在于其专注于腰果树健康状态的视觉识别,涵盖了非生物胁迫、虫害与病害三大关键类别。数据规模达到数千张高质量航拍图像,标注实例总数超过两万,其中非生物胁迫类标注最为丰富。图像的高分辨率特性为模型捕捉细微症状提供了可能,而标准的YOLO格式标注则确保了与主流目标检测框架的无缝兼容。数据集已按训练、验证与测试划分,文件夹结构清晰,便于研究者直接投入算法开发与评估。
使用方法
该数据集主要应用于计算机视觉领域的目标检测任务,尤其服务于农业病虫害智能监测模型的研发。使用者下载数据后,可依据其提供的标准文件夹结构,直接加载图像及对应的YOLO格式标签文件进行模型训练。在算法开发流程中,研究者可利用已划分的训练集进行模型学习,通过验证集调整超参数,并最终在独立的测试集上评估模型对‘abiotic’、‘insect’、‘disease’三类目标的识别性能。为深入理解数据细节,建议参考其随附的数据手册。
背景与挑战
背景概述
在精准农业与植物病理学交叉领域,无人机遥感技术与人工智能的结合为作物病害智能监测开辟了新路径。由KaraAgro AI基金会主导,并得到德国国际合作机构(GIZ)及其项目资助的CADI-AI数据集,于近年应运而生,旨在通过高分辨率无人机影像,系统识别腰果树所面临的生物与非生物胁迫。该数据集聚焦于三类关键类别——病害、虫害及非生物胁迫,共包含逾四千张精细标注图像,为开发鲁棒性视觉检测模型提供了珍贵资源,有力推动了热带经济作物智慧保护研究的发展。
当前挑战
该数据集致力于解决农业视觉检测中复杂环境下的多类别异常识别挑战,具体包括在自然光照变化、枝叶遮挡及形态多样性背景下,对病害、虫害和生理胁迫进行精准区分与定位。在构建过程中,团队面临诸多困难:野外数据采集受天气与地理条件制约,影像质量一致性难以保障;专家标注需融合农学知识与视觉判别,耗时且成本高昂;此外,类别不平衡问题显著,如非生物胁迫实例远多于虫害实例,对模型训练的公平性与泛化能力构成严峻考验。
常用场景
经典使用场景
在农业智能监测领域,CADI-AI数据集为基于无人机视觉的腰果树病虫害检测提供了关键支持。该数据集包含高分辨率图像及YOLO格式标注,涵盖非生物胁迫、虫害和病害三类目标,常用于训练和评估深度学习模型,以实现对腰果树健康状况的自动化、精准识别。其精细的边界框标注使得模型能够准确定位异常区域,为农业病害的早期预警奠定基础。
实际应用
在实际农业生产中,CADI-AI数据集支撑的智能系统能够辅助农户进行大规模腰果园的病害监测。通过部署基于该数据集训练的模型,无人机可定期巡航拍摄,自动识别病虫害类型与位置,生成可视化报告。这不仅减少了人工巡查的成本与时间,还能实现精准施药,降低农药滥用,提升作物产量与质量,对可持续农业发展具有重要实践价值。
衍生相关工作
围绕CADI-AI数据集,已衍生出一系列经典研究工作。例如,研究者利用其进行YOLO系列模型的性能优化,探索轻量化网络在移动设备上的部署。同时,该数据集也促进了多任务学习框架的开发,如结合病害分类与严重度评估。此外,一些工作专注于数据增强策略,以应对光照、角度变化,进一步提升了模型在真实农田环境中的鲁棒性与适应性。
以上内容由遇见数据集搜集并总结生成



