多类别草莓成熟度检测数据集
收藏arXiv2026-02-24 更新2026-02-19 收录
下载链接:
https://www.kaggle.com/datasets/mahyeks/multi-class-strawberry-ripeness-detection-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由土耳其克勒克卡莱大学团队创建,包含566张在两种不同温室环境下采集的草莓图像,涵盖不同光照条件(直射光、漫射光等)。数据集包含1,734个标注对象,按成熟度分为全熟(520)、半熟(247)和未熟(967)三类,采用边界框手动标注。数据旨在解决传统草莓成熟度检测主观性强的问题,为智能农业中的实时成熟度识别、自主采摘机器人等应用提供基准数据。通过公开共享,该数据集填补了现有研究缺乏可比较公共数据的空白。
This dataset was developed by a research team from Kırıkkale University, Turkey. It comprises 566 strawberry images acquired under two different greenhouse environments, spanning various lighting conditions including direct light, diffused light, etc. A total of 1,734 annotated objects are included, which are classified into three maturity categories: fully ripe (520), semi-ripe (247), and unripe (967), with manual bounding box annotations. This dataset is designed to mitigate the strong subjectivity issue in traditional strawberry maturity detection, serving as benchmark data for applications like real-time maturity recognition and autonomous harvesting robots in smart agriculture. By making this dataset publicly available, it fills the gap in existing research where comparable public datasets are lacking.
提供机构:
克勒克卡莱大学; 哈吉·贝克塔什·维利大学; 塞尔柱大学
创建时间:
2026-02-17
搜集汇总
数据集介绍
构建方式
在精准农业与计算机视觉交叉领域,草莓成熟度自动检测对提升采收效率与产品质量至关重要。该数据集的构建源于对现有研究缺乏公开、多样化数据的回应,旨在为智能农业应用提供一个可复现的基准。数据采集于土耳其两个不同的温室环境,使用三星NX相机与手机相机,在变化的光照条件下(如直射阳光、局部遮阴和漫射光)拍摄,以模拟真实生产场景的复杂性。最终数据集包含566张图像,通过人工边界框标注方法,细致标注了1,734个对象,划分为完全成熟、半成熟与未成熟三个类别,确保了标注的准确性与一致性。
特点
该数据集在草莓成熟度检测领域展现出鲜明的实用性与学术价值。其核心特点在于真实反映了温室种植的多样性,涵盖了不同背景、种植密度与光照条件,增强了模型在复杂环境下的泛化能力。数据集中类别分布存在天然不平衡,未成熟样本占据主导,这恰当地模拟了实际生产中草莓成熟状态的分布,为研究类别不平衡问题提供了真实场景。此外,数据集完全公开可用,弥补了该领域多数研究使用私有数据导致的比较性与可复现性不足的缺陷,为后续研究建立了透明的基准。
使用方法
该数据集主要服务于基于深度学习的草莓成熟度检测模型的开发、训练与评估。研究人员可利用其进行目标检测算法的性能验证,特别是YOLO系列等单阶段检测器。典型工作流程包括将数据集按既定比例划分为训练集与测试集,用于模型训练与性能测试。评估时,可综合使用精确率、召回率、mAP@50等准确率指标,并结合FLOPs、参数量、FPS等计算效率指标,以全面衡量模型在精度与实时性之间的平衡。该数据集也为系统比较不同模型架构(如YOLOv8、YOLOv9、YOLO11)在相同条件下的表现提供了基础,助力于选择最适合实际部署的轻量化、高效率模型。
背景与挑战
背景概述
草莓作为全球广泛种植的高经济价值水果,其成熟度精准检测对保障生产效益与消费品质至关重要。传统依赖人工视觉评估的方法存在主观性强、误差率高等固有缺陷,难以满足现代农业规模化、标准化生产需求。在此背景下,由土耳其基里卡莱大学Mustafa Yurdakul等研究人员于近期构建的‘多类别草莓成熟度检测数据集’,旨在为基于计算机视觉的自动化检测研究提供公开、标准化的数据基础。该数据集包含从土耳其两个不同温室采集的566幅图像及1734个标注对象,涵盖完全成熟、半熟与未熟三类,并记录了多变光照与环境条件,为智能农业领域的算法开发与性能比较建立了关键基准。
当前挑战
该数据集致力于解决草莓成熟度自动化检测这一核心领域问题,其面临的主要挑战体现在两方面:在领域问题层面,成熟度检测需精准区分颜色、纹理特征相近的过渡类别(如半熟果实),并在复杂农业场景(如枝叶遮挡、光照不均、果实密集)下保持鲁棒性;在数据集构建层面,挑战包括在真实温室环境中采集具有充分光照与背景多样性的图像,进行精细且一致的人工标注以区分细微的成熟度差异,以及克服类别分布不均衡(未熟类样本显著多于其他类别)对模型训练带来的潜在偏差。
常用场景
经典使用场景
在精准农业与智能采摘系统研究中,该数据集为草莓成熟度自动检测算法的开发与评估提供了标准化基准。研究人员利用其包含的566张图像及1201个标注对象,在可变光照与温室环境下,系统性地训练与验证YOLO系列等目标检测模型。通过对比YOLOv8、YOLOv9与YOLO11等架构在相同数据条件下的性能表现,该数据集有效支撑了模型在精度、召回率及计算效率等方面的综合比较,成为探索轻量化模型在农业视觉任务中适用性的关键实验平台。
实际应用
在实际农业场景中,该数据集直接服务于草莓智能采摘机器人的视觉系统开发。通过训练基于该数据集的检测模型,机器人能够实时识别田间草莓的成熟状态(全熟、半熟、未熟),从而实现自动化选择性采收,减少因人工误判导致的经济损失。此外,数据集涵盖的复杂光照与遮挡条件增强了模型的鲁棒性,使其能够适应真实温室环境下的动态变化,为提升采收效率、降低劳动成本并保障果实品质一致性提供了可靠的技术支撑。
衍生相关工作
围绕该数据集,衍生出一系列聚焦于草莓成熟度检测的经典研究工作。例如,基于YOLO架构的改进模型如YOLOv11-GSF在精度与召回率上实现了进一步提升;Transformer-based的FruitQuery模型则探索了查询式实例分割在田间环境下的适用性。同时,两阶段融合模型(如U-Net + TBAF)被用于草莓采收日期预测,而SRR-Net等模型则专注于提升算法在多变光照条件下的稳定性。这些工作共同推动了草莓视觉检测技术向更高效、更鲁棒的方向演进。
以上内容由遇见数据集搜集并总结生成



