deep-plants/AGM
收藏数据集卡片 AGM 数据集
数据集概述
AGM (AGricolaModerna) 数据集是一个全面的高分辨率RGB图像集合,捕捉垂直农场环境中收获准备的植物。该数据集包含972,858张图像,每张图像分辨率为120x120像素,涵盖18种不同的植物作物。在这个数据集中,作物指的是植物物种或植物物种的混合。
支持的任务
图像分类:植物表型分析
数据集结构
数据实例
训练集中的典型数据实例包括以下内容:
{ image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=120x120 at 0x29CEAD71780>, crop_type: by }
数据字段
数据集的数据实例具有以下字段:
image:表示图像的PIL.Image.Image对象。crop_type:图像中作物类型的字符串表示。
数据分割
- 训练集:
- 样本数量:972,858
数据集创建
创建动机
AGM数据集的创建动机是需要一个大型且多样化的数据集,以捕捉现代农业的各个方面,包括植物物种多样性、应激检测和作物健康评估。
源数据
初始数据收集和规范化
图像使用位于农业环境中移动台上方的高分辨率相机捕捉。相机捕捉整个台面的图像,台面上装满了收获作物的托盘。图像捕捉过程从2022年5月持续到2022年12月。原始图像的分辨率为$1073{ imes}650$像素。图像中的每个像素对应于$0.5$毫米的物理尺寸。
标注
标注过程
农学家和领域专家参与了标注过程。他们标注每张图像以识别存在的作物并将其分配到特定类别或物种。此标注过程涉及将每张图像标记为18个不同作物类别之一,这些类别包括单个植物物种和物种混合。
标注者
标注者是Agricola Moderna雇佣的农学家。
个人和敏感信息
数据集不包含关于个人的个人或敏感信息。它主要包含植物的图像。
使用数据集的考虑因素
数据集的社会影响
AGM数据集在现代农业及相关领域具有潜在的社会影响。它可以通过协助开发用于作物监测、疾病检测和产量预测的创新技术,促进可持续农业实践,有助于食品安全并确保更高的农业生产力和可负担性。该数据集支持环境可持续农业的研究,优化资源使用并减少环境影响。
偏见和已知限制的讨论
数据集主要涉及来自单一垂直农场环境的图像,因此虽然规模庞大,但作物类型的变化相对较小。数据集的内容和标注可能反映区域农业实践和偏好。商业偏好也在很大程度上决定了垂直农场中种植的作物类型。这些偏好通常受市场需求和盈利能力的影响,可能与传统的露天田间农业有很大差异。因此,数据集可能固有地反映这些商业驱动的作物选择,可能影响其对更广泛农业场景的代表性。




