deep-plants/AGM

Name: deep-plants/AGM
Creator: deep-plants
Published: 2023-10-04 11:06:53
License: 暂无描述

Hugging Face2023-10-04 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/deep-plants/AGM

下载链接

链接失效反馈

官方服务：

资源简介：

AGM（AGricolaModerna）数据集是一个包含高分辨率RGB图像的综合性数据集，这些图像捕捉了垂直农场环境中成熟的植物。该数据集包含972,858张图像，每张图像的分辨率为120x120像素，涵盖了18种不同的植物作物。在数据集的上下文中，作物指的是植物物种或植物物种的混合物。数据集主要用于图像分类任务，特别是植物表型分析。

The AGM (AGricolaModerna) dataset is a comprehensive dataset containing high-resolution RGB images that capture mature plants in vertical farm environments. This dataset includes 972,858 images, each with a resolution of 120×120 pixels, covering 18 distinct plant crops. Within the context of this dataset, a crop refers to a plant species or a mixture of plant species. The dataset is primarily used for image classification tasks, especially plant phenotyping analysis.

提供机构：

deep-plants

原始信息汇总

数据集卡片 AGM 数据集

数据集概述

AGM (AGricolaModerna) 数据集是一个全面的高分辨率RGB图像集合，捕捉垂直农场环境中收获准备的植物。该数据集包含972,858张图像，每张图像分辨率为120x120像素，涵盖18种不同的植物作物。在这个数据集中，作物指的是植物物种或植物物种的混合。

支持的任务

图像分类：植物表型分析

数据集结构

数据实例

训练集中的典型数据实例包括以下内容：

{ image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=120x120 at 0x29CEAD71780>, crop_type: by }

数据字段

数据集的数据实例具有以下字段：

image：表示图像的PIL.Image.Image对象。
crop_type：图像中作物类型的字符串表示。

数据分割

训练集：
- 样本数量：972,858

数据集创建

创建动机

AGM数据集的创建动机是需要一个大型且多样化的数据集，以捕捉现代农业的各个方面，包括植物物种多样性、应激检测和作物健康评估。

源数据

初始数据收集和规范化

图像使用位于农业环境中移动台上方的高分辨率相机捕捉。相机捕捉整个台面的图像，台面上装满了收获作物的托盘。图像捕捉过程从2022年5月持续到2022年12月。原始图像的分辨率为$1073{ imes}650$像素。图像中的每个像素对应于$0.5$毫米的物理尺寸。

标注

标注过程

农学家和领域专家参与了标注过程。他们标注每张图像以识别存在的作物并将其分配到特定类别或物种。此标注过程涉及将每张图像标记为18个不同作物类别之一，这些类别包括单个植物物种和物种混合。

标注者

标注者是Agricola Moderna雇佣的农学家。

个人和敏感信息

数据集不包含关于个人的个人或敏感信息。它主要包含植物的图像。

使用数据集的考虑因素

数据集的社会影响

AGM数据集在现代农业及相关领域具有潜在的社会影响。它可以通过协助开发用于作物监测、疾病检测和产量预测的创新技术，促进可持续农业实践，有助于食品安全并确保更高的农业生产力和可负担性。该数据集支持环境可持续农业的研究，优化资源使用并减少环境影响。

偏见和已知限制的讨论

数据集主要涉及来自单一垂直农场环境的图像，因此虽然规模庞大，但作物类型的变化相对较小。数据集的内容和标注可能反映区域农业实践和偏好。商业偏好也在很大程度上决定了垂直农场中种植的作物类型。这些偏好通常受市场需求和盈利能力的影响，可能与传统的露天田间农业有很大差异。因此，数据集可能固有地反映这些商业驱动的作物选择，可能影响其对更广泛农业场景的代表性。

搜集汇总

数据集介绍

构建方式

在垂直农业领域，AGM数据集的构建体现了对植物表型精准捕捉的追求。该数据集通过高分辨率相机在移动工作台上方系统采集图像，覆盖了2022年5月至12月的完整生长周期。原始图像分辨率为1073×650像素，每像素对应0.5毫米的物理尺度，确保了微观特征的完整性。随后，由Agricola Moderna的农艺学专家对图像进行精细标注，将每张图像归类至18种特定作物类别，涵盖单一物种及混合种植类型，最终形成包含972,858张120×120像素标准化图像的训练集。

特点

AGM数据集的核心特征在于其高度专业化的垂直农场环境样本。所有图像均采集自受控农业设施，聚焦于收获期植物的形态特征，为植物表型研究提供了高度一致的光照与背景条件。数据集中包含的18类作物反映了现代垂直农业的商业化种植偏好，虽在作物多样性上存在天然局限，却为特定农业场景下的模型训练提供了密集且高质量的视觉样本。图像统一处理为120×120像素的RGB格式，在保留关键形态信息的同时实现了存储与计算效率的优化。

使用方法

该数据集主要应用于图像分类任务，特别是植物表型识别与分析。研究者可直接加载HuggingFace平台提供的标准化数据分割，利用`image`字段获取预处理后的植物图像，并通过`crop_type`字段获取对应的作物类别标签。在模型训练过程中，建议结合迁移学习方法，以利用数据集中丰富的垂直农场视觉特征，提升在作物健康监测、胁迫识别等农业人工智能应用中的泛化能力。使用时应关注数据集固有的环境单一性，通过数据增强或跨领域适应技术弥补场景差异。

背景与挑战

背景概述

在精准农业与植物表型组学蓬勃发展的背景下，垂直农场作为一种高效可控的农业生产模式，对自动化监测技术提出了迫切需求。由DeepPlants与Agricola Moderna联合创建的AGM数据集应运而生，其构建工作于2022年5月至12月间完成，并于2023年在国际计算机视觉大会（ICCV）上正式发布。该数据集的核心研究问题聚焦于垂直农场环境下成熟作物的精细识别与分类，旨在为植物表型分析提供大规模、高质量的图像基准。通过收录超过97万张高分辨率RGB图像，涵盖18种不同作物类别，AGM数据集显著推动了计算机视觉技术在智慧农业中的应用，为作物健康评估、胁迫检测等关键任务奠定了坚实的数据基础。

当前挑战

AGM数据集致力于解决垂直农场中植物表型自动识别的核心挑战，其首要难点在于如何从外观高度相似、种植密集的成熟作物中，实现多物种乃至混合物种的精准分类。这要求模型具备极强的细粒度特征辨别能力。在数据集构建层面，挑战同样显著：图像采集受限于单一垂直农场的固定环境，导致数据多样性不足，难以全面覆盖不同光照、生长阶段及栽培条件下的作物形态；同时，数据标注高度依赖领域专家，流程复杂且成本高昂。此外，数据集所包含的作物种类深受特定商业偏好与区域农业实践影响，可能引入选择偏差，限制了其模型在更广泛农业场景中的泛化能力与代表性。

常用场景

经典使用场景

在垂直农业的背景下，AGM数据集为植物表型分析提供了丰富的视觉资源。该数据集通过高分辨率RGB图像捕捉了18种不同作物在收获阶段的状态，为图像分类任务奠定了坚实基础。研究者利用这些图像训练深度学习模型，实现对作物种类的自动识别，从而支持精准农业中的作物监测与管理。

解决学术问题

AGM数据集主要解决了植物表型分析中数据稀缺与多样性不足的学术挑战。通过提供大规模、标注准确的图像数据，它促进了机器学习模型在农业领域的应用，特别是在作物健康评估、胁迫检测和物种分类等方面。该数据集的意义在于推动了计算机视觉与农业科学的交叉研究，为可持续农业技术的发展提供了数据支撑。

衍生相关工作

基于AGM数据集，多项经典研究工作得以展开，包括迁移学习方法的探索和植物表型模型的优化。例如，相关研究利用该数据集训练卷积神经网络，实现了对作物混合种类的精细分类。这些工作不仅提升了模型在农业图像分析中的性能，还为其他垂直农场数据集的建设提供了参考框架。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集