Blueberry Detection Dataset
收藏arXiv2025-09-25 更新2025-09-27 收录
下载链接:
https://github.com/rogermu789/BlueberryBenchmark
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是密歇根州立大学创建的,用于蓝莓检测和成熟度评估,包含661张通过智能手机在不同光照条件下拍摄的蓝莓冠层图像,共85,879个手动标注的实例(包括36,256个成熟的蓝莓和49,623个未成熟的蓝莓)。数据集旨在解决实际果园环境中蓝莓检测的挑战,如自然光照的变化、遮挡和果实成熟阶段的多样性。该数据集可用于开发鲁棒的蓝莓检测模型,以提高计算机视觉技术在果园管理中的应用效果。
This dataset was created by Michigan State University for blueberry detection and maturity assessment. It comprises 661 blueberry canopy images captured with smartphones under varying lighting conditions, with a total of 85,879 manually annotated instances, including 36,256 mature blueberries and 49,623 immature blueberries. This dataset is designed to address the challenges of blueberry detection in real-world orchard environments, such as fluctuating natural lighting, fruit occlusion, and the diversity of fruit maturity stages. It can be utilized to develop robust blueberry detection models to improve the application effectiveness of computer vision technology in orchard management.
提供机构:
密歇根州立大学(Michigan State University)
创建时间:
2025-09-25
原始信息汇总
BlueberryBenchmark 数据集概述
数据集名称
BlueberryBenchmark
数据集来源
GitHub 仓库:https://github.com/rogermu789/BlueberryBenchmark
搜集汇总
数据集介绍

构建方式
在精准园艺管理领域,蓝莓检测数据集的构建采用了多季节、多设备的图像采集策略。研究人员于2022至2023年间使用智能手机在商业农场和科研基地共采集661张冠层图像,涵盖不同光照条件、遮挡情况及果实成熟阶段。通过专业标注工具VGG Image Annotator对85,879个蓝莓实例进行人工精细标注,区分成熟与未成熟果实,并经过独立质量审核确保标注准确性。标注结果转换为YOLO和COCO格式,为不同检测模型提供标准化数据支持。
特点
该数据集显著特点在于其规模与多样性,包含36,256个成熟和49,623个未成熟蓝莓实例,覆盖从单枝到整体冠层的多尺度空间信息。图像采集环境模拟真实果园的复杂性,包括自然光照波动、枝叶遮挡及运动模糊等挑战性场景。数据集特别注重果实成熟度的连续性表征,从绿色到深蓝色的颜色渐变过程为成熟度评估提供了丰富视觉依据。此外,2024年通过地面移动平台采集的1,035张未标记图像进一步扩展了数据分布范围,为半监督学习研究提供跨域数据资源。
使用方法
该数据集支持监督学习与半监督学习两种应用范式。在监督学习场景下,研究人员可按75:5:20比例划分训练、验证和测试集,利用YOLO或RT-DETR等实时检测模型进行基准测试。针对半监督学习需求,可采用无偏均值教师框架或Semi-DETR方法,通过教师模型生成未标记数据的伪标签,结合置信度过滤和一致性正则化策略提升模型泛化能力。数据集兼容多种分辨率输入,建议使用1024×1024像素平衡检测精度与计算效率,并可通过数据增强技术提升模型对复杂果园环境的适应性。
背景与挑战
背景概述
随着蓝莓产业在全球范围内的快速发展,精准果园管理对自动化视觉检测技术提出了迫切需求。2025年由密歇根州立大学农业工程团队发布的蓝莓检测数据集,通过2022-2023年采集的661幅冠层图像构建了包含85,879个标注实例的基准数据,涵盖不同光照条件、遮挡场景及果实成熟度阶段。该数据集针对蓝莓成熟度评估与产量估算等核心问题,为深度学习模型在复杂自然环境下的泛化能力提供了重要支撑,推动了精准园艺领域的技术革新。
当前挑战
该数据集致力于解决自然环境下蓝莓检测的多重挑战:果实尺寸小、密集簇生与枝叶遮挡导致个体识别困难,光照波动与运动模糊干扰特征提取,成熟度颜色渐变增加分类复杂度。构建过程中面临标注瓶颈,高密度小目标标注需专业人员精细操作,跨季节数据采集存在分布差异,同时需平衡模型精度与边缘设备部署的实时性需求,这些因素共同构成了数据集应用与优化的关键难点。
常用场景
经典使用场景
在精准园艺管理领域,Blueberry Detection Dataset为实时目标检测算法提供了标准化评估基准。该数据集通过包含661张蓝莓冠层图像和85,879个标注实例,系统捕捉了自然光照变化、枝叶遮挡和果实成熟度差异等真实果园环境特征。研究团队基于此数据集对YOLO系列和RT-DETR系列共36个模型变体进行对比测试,其中YOLOv12m达到93.3%的mAP@50,RT-DETRv2-X更是取得93.6%的检测精度,为算法选择提供了实证依据。
实际应用
在实际果园管理中,该数据集支撑的检测技术已应用于采收决策和产量预估等关键环节。基于手机端部署的YOLOv8模型开发的BlueberryCounter移动应用,实现了田间蓝莓的实时计数与成熟度评估。搭载机器视觉平台的检测系统能够以0.2米/秒的移动速度进行冠层扫描,为规模化种植园提供自动化监测方案。这些应用显著降低了传统人工评估的时间成本,使采收时机的判断精度从经验猜测提升到量化分析层面。
衍生相关工作
该数据集催生了多项创新性研究,包括基于Unbiased Mean Teacher的半监督检测框架和专为RT-DETR设计的Semi-DETR算法。在跨域适应方面,Deng等人利用平台采集的无标签数据开展迁移学习研究,使RT-DETRv2-X模型精度提升至94.8%。Mu等人正在开发的多视角全冠层成像系统,进一步扩展了数据集在三维果实定位中的应用边界。这些衍生工作共同推动了农业视觉检测从算法验证向系统工程化的演进。
以上内容由遇见数据集搜集并总结生成



