AI Agriculture Datasets Collection
收藏github2026-01-26 更新2026-02-03 收录
下载链接:
https://github.com/ai-agriculture-circuits-and-systems/agriculture-collections
下载链接
链接失效反馈官方服务:
资源简介:
一个包含82个数据集的综合集合,来自ai-agriculture-circuits-and-systems GitHub组织,专为农业AI和计算机视觉研究而策划。
A comprehensive collection of 82 datasets sourced from the ai-agriculture-circuits-and-systems GitHub organization, specially curated for agricultural AI and computer vision research.
创建时间:
2026-01-24
原始信息汇总
AI Agriculture Datasets Collection 数据集概述
数据集总览
- 数据集总数: 82个
- 总图像数量: 超过1,369,089张
- 主要任务类型: 分类、检测、分割、质量分析、计数
- 主要许可证: CC BY 4.0(知识共享署名4.0国际许可协议)
- 最后更新: 2026年1月
数据集统计概览
总体统计
- 总星标数: 107
- Python代码库: 66个(占80%)
- CC-BY许可数据集: 14个
- 包含图像的代码库: 74个(占81个中的91%)
- 提供图像数量的数据集: 55个
- 提供类别信息的数据集: 43个
- 提供样本图像的数据集: 34个以上代码库,共249张样本图像
数据集规模分布
- 超大数据集(10万张图像以上): 1个(plant_village)
- 大型数据集(5万-10万张图像): 5个
- 中型数据集(1万-5万张图像): 10个
- 小型数据集(1千-1万张图像): 30个
- 迷你数据集(1千张图像以下): 28个
类别分布
- 叶片病害分类: 34个数据集(占41%)
- 果实检测与分类: 22个数据集(占27%)
- 作物分割: 7个数据集(占9%)
- 花朵检测与分割: 5个数据集(占6%)
- 杂草检测与分割: 3个数据集(占4%)
- 其他数据集: 4个数据集(占5%)
- 工具与模型: 7个数据集(占9%)
数据集类别详情
🍎 果实检测与分类(22个数据集)
用于检测、分类和分析不同生长阶段果实的数据集。
关键数据集示例:
- AppleBBCH76: 苹果幼果数据集(BBCH阶段76-78),3,169张图像,1个类别,检测任务,YOLO/COCO格式,640×640分辨率,CC BY 4.0许可。
- RawRipe: 包含生熟两种状态的果实图像数据集,1,630张图像,20个类别,分类任务,可变分辨率,CC BY 4.0许可。
- deepfruits: 包含21,122张水果图像的综合标注数据集,涵盖8种水果类型,分类任务。
- PlantVillage: 最大的数据集,包含171,238张图像,38个类别。
🍃 叶片病害分类(34个数据集)
用于识别和分类植物叶片病害的综合数据集。
关键数据集示例:
- plant_village: 植物叶片图像综合数据集,54,304张图像,38个病害/健康类别,分类任务,256×256分辨率,CC BY 3.0许可。
- Plant_Village_Corn: 玉米叶片病害分类数据集,44,096张图像,5个类别。
- tomato_leaf_disease: 番茄叶片病害分类数据集,10,583张图像,10个类别,256×256分辨率,CC BY 4.0许可。
- plant_doc_detection: 包含2,585张图像,涵盖13种植物物种和29个病害类别。
🌾 杂草检测与分割(3个数据集)
用于农田杂草识别和分割的数据集。
关键数据集示例:
- deep_weeds: 大规模数据集,包含17,509张现场图像,涵盖8种杂草物种和1个负类别,256×256分辨率,CC BY 4.0许可。
- rangeland_weeds_australia: 多类别杂草检测数据集,包含565张图像,7个类别,检测任务。
- soybean_weed_uav_brazil: 高分辨率无人机采集图像,用于巴西大豆作物、土壤和杂草分类。
技术特征
- 图像类型: 主要为RGB图像,包含地面拍摄、无人机(UAV)采集、手持/田间拍摄以及合成图像。
- 数据格式: 支持YOLO、COCO、CSV、JSON等多种标注格式。
- 分辨率: 从256×256到高分辨率不等,部分数据集提供固定尺寸图像。
- 采集方式: 包括地面采集、无人机航拍和合成生成。
许可证信息
- 主要许可证为CC BY 4.0(知识共享署名4.0国际许可协议)。
- 部分数据集采用其他许可证或自定义许可。
- 少数数据集许可证信息未明确提供。
搜集汇总
数据集介绍

构建方式
在农业人工智能研究领域,数据集的系统化构建是推动精准农业发展的关键基石。AI Agriculture Datasets Collection 通过整合来自 ai-agriculture-circuits-and-systems GitHub 组织的开源资源,系统性地汇集了82个独立数据集。其构建过程遵循严格的学术规范,涵盖图像采集、标注与分类流程,数据来源包括地面拍摄、无人机航拍以及合成图像生成等多种技术手段。每个数据集均经过标准化处理,提供统一的YOLO、COCO或CSV/JSON格式标注,并依据BBCH物候期标准或疾病分类体系进行专业标注,确保了数据在农业视觉任务中的科学性与可用性。
特点
该数据集集合展现出显著的规模性与多样性特征,囊括超过136万张农业图像,覆盖果实检测、叶片病害分类、杂草识别、作物分割及花朵分析等五大核心任务类别。其独特之处在于深度聚焦农业细分场景,例如苹果、樱桃等果树在不同生长阶段的专用数据集,以及PlantVillage这样包含38个类别的超大规模叶片病害库。数据模态涵盖常规RGB图像、高光谱数据乃至合成图像,分辨率从256×256到高分辨率不等,且近半数数据集采用CC-BY系列开源许可,为学术研究提供了充分的合法使用空间。
使用方法
研究人员可依据具体农业视觉任务,通过数据集提供的GitHub仓库链接访问结构化数据资源。典型工作流程包括:根据任务类型(如分类、检测、分割)选择相应数据集,下载包含图像与标注文件的标准化包;利用预置的YOLO、COCO或CSV/JSON格式标注直接接入主流深度学习框架进行模型训练;对于多任务研究,可跨数据集整合资源,例如结合不同物候期的果实检测数据构建生长监测模型。数据集中包含的样本图库与详细统计信息,能为实验设计提供直观参考,而统一的元数据描述则显著降低了数据预处理与模型适配的工程复杂度。
背景与挑战
背景概述
随着精准农业与人工智能技术的深度融合,农业计算机视觉研究对高质量、大规模标注数据集的需求日益迫切。在此背景下,AI Agriculture Datasets Collection应运而生,该数据集由GitHub组织“ai-agriculture-circuits-and-systems”于近年系统构建与维护,其核心目标在于整合分散的农业视觉数据资源,为作物病害识别、果实检测、杂草分割等关键农业任务提供统一、全面的基准数据支持。该集合汇聚了涵盖82个子数据集、超过136万张图像,涉及叶片病害分类、果实检测与分类、作物分割等多个精细类别,极大地推动了农业智能感知模型的开发与评估,成为连接农业科学与人工智能技术的重要桥梁。
当前挑战
该数据集致力于解决农业视觉领域中的细粒度分类与复杂场景感知问题,例如在自然光照变化、作物生长阶段差异以及背景混杂条件下实现高精度的病害诊断与目标检测。然而,其构建与应用仍面临多重挑战:在数据层面,各子数据集在图像分辨率、标注格式(如YOLO、COCO)、采集视角(地面、无人机)及许可协议上存在显著异质性,为模型统一训练与公平比较带来困难;在技术层面,农业场景固有的类内差异大、类间相似性高以及小样本类别不均衡等问题,对模型的泛化能力与鲁棒性提出了严峻考验。
常用场景
经典使用场景
在精准农业与计算机视觉交叉领域,该数据集集合为农业目标检测与分类任务提供了标准化的基准测试平台。其经典使用场景集中于利用深度学习模型,如果实检测、叶片病害识别及杂草分割,对高分辨率农田图像进行自动化分析。研究人员通过调用其中标注规范的子集,如AppleBBCH76或PlantVillage,能够系统评估YOLO、Faster R-CNN等算法在复杂自然环境下的鲁棒性与精度,从而推动农业视觉技术的迭代优化。
衍生相关工作
围绕该数据集集合,学术界已涌现出一系列经典研究工作。例如,基于PlantVillage的卷积神经网络架构比较研究,系统评估了ResNet、DenseNet在叶片病害分类中的性能;而DeepWeeds数据集则催生了针对杂草识别的轻量化模型设计,如MobileNet变种。此外,跨数据集迁移学习框架的探索,如果实检测模型从acfr-multifruit-2016到无人机图像的适应,进一步拓展了农业视觉技术的应用边界。
数据集最近研究
最新研究方向
在精准农业与智慧农场的宏大背景下,AI Agriculture Datasets Collection 作为涵盖82个数据集、超过137万张图像的综合性资源库,正推动农业人工智能研究迈向新的高度。当前的前沿探索聚焦于多模态数据融合与细粒度视觉分析,研究者们正利用该集合中丰富的无人机航拍图像与地面采集数据,开发能够同步处理果实检测、病害分类与杂草分割的端到端模型。这一趋势与全球范围内农业自动化与可持续生产的迫切需求紧密相连,特别是在应对气候变化引发的作物胁迫与病虫害频发等热点挑战中,此类大规模、多任务的数据集为构建鲁棒且可解释的农业视觉系统提供了不可或缺的基石,显著加速了从实验室算法到田间实际应用的转化进程。
以上内容由遇见数据集搜集并总结生成



