five

MinneApple

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/nicolaihaeni/minneapple
下载链接
链接失效反馈
官方服务:
更多采购需求
资源简介:
该数据集旨在推进果园环境中水果的计数、检测和分割技术,包含了苹果的图像。注释信息包括基于补丁的计数以及为每个苹果实例绘制的遮罩。该数据集规模包含1,000张图像,超过41,000个标注的对象实例。其任务是对水果检测和分割进行监督式的微调。

This dataset aims to advance fruit counting, detection and segmentation techniques in orchard environments, and contains images of apples. Its annotations include patch-based counting and masks drawn for each individual apple instance. The dataset comprises 1,000 images and over 41,000 annotated object instances. The target task is to perform supervised fine-tuning for fruit detection and segmentation.
提供机构:
University of Minnesota
搜集汇总
数据集介绍
main_image_url
构建方式
在农业自动化领域,精准的果实检测与分割对果园管理至关重要。MinneApple数据集的构建基于明尼苏达大学园艺研究中心在2015至2016年间采集的视频数据,使用三星Galaxy S4手机沿树行水平拍摄,以约1米/秒的速度移动以减少运动模糊。从视频序列中每五帧提取一张图像,测试集则每30帧提取一张,最终获得1000张1280×720像素的高分辨率图像。通过人工标注,对前景树上的苹果实例使用多边形掩码进行精细标注,涵盖17个不同树行,包括多种苹果品种、成熟阶段和光照条件,确保了数据的多样性和独立性。标注过程采用VGG标注工具,每张图像由单一标注员完成,并经过培训和验证步骤以保证质量,总计标注超过41,000个实例,构建了检测、分割和计数三个子数据集。
特点
MinneApple数据集在果实检测领域展现出显著特点,其图像源自真实果园环境,包含丰富的自然变异,如不同光照、果实外观和枝叶遮挡。数据集中每个图像平均包含41.2个实例,最多可达120个,对象尺寸较小,平均仅占图像的0.17%,这模拟了实际果园中密集小目标检测的挑战。与通用数据集如COCO相比,MinneApple专注于单一类别(苹果),但实例数量远超同类,提供了高度专业化的测试平台。此外,数据集通过分年采集训练和测试数据,确保了评估的公正性,避免了过拟合问题,为算法泛化能力提供了可靠基准。
使用方法
MinneApple数据集支持多种计算机视觉任务的应用,包括目标检测、实例分割和果实计数。研究人员可利用提供的多边形标注训练深度学习模型,如Faster R-CNN或Mask R-CNN,进行边界框检测和分割;对于计数任务,数据集提供了基于图像块的标注,适用于训练卷积神经网络进行聚类果实统计。使用前,建议从项目网站下载数据,并遵循公开的评估协议,如通过CodaLab挑战提交结果以进行公平比较。数据集已划分训练和测试集,训练集包含670张图像,测试集331张,确保了算法评估的标准化。此外,基线性能分析可作为参考,帮助优化模型在小型、密集对象上的表现。
背景与挑战
背景概述
在农业自动化领域,果园环境下的果实检测、分割与计数是实现精准农业与智能采摘的关键技术。MinneApple数据集由明尼苏达大学计算机科学与工程系的Nicolai Häni、Pravakar Roy和Volkan Isler等人于2020年发布,旨在解决该领域长期缺乏统一基准数据集的问题。该数据集包含1000张高分辨率果园图像,标注了超过41,000个苹果实例的多边形掩码,覆盖了17种不同树行、多种苹果品种及不同光照条件。其核心研究问题聚焦于提升复杂自然场景中小目标物体的检测精度与鲁棒性,为果实产量估计、自动化收获等应用提供可靠的数据支撑,显著推动了计算机视觉在农业机器人领域的标准化研究与算法比较。
当前挑战
MinneApple数据集所针对的果实检测与分割任务面临多重挑战:在领域问题层面,果园环境中的果实常因光照变化、枝叶遮挡、果实密集重叠及外观多样性(如颜色、成熟度差异)而导致检测模型性能下降;同时,目标物体尺寸较小(平均仅占图像的0.17%),且单张图像中实例数量可达上百个,对现有检测算法的尺度适应性与密集目标处理能力提出了更高要求。在数据集构建过程中,标注工作因图像中实例数量庞大、目标尺寸微小以及频繁遮挡而极为耗时,平均单张图像标注需30分钟;此外,为确保数据多样性与泛化性,需跨年份、跨树行采集数据,并设计独立训练与测试集以规避过拟合,这些因素均增加了数据收集与校验的复杂度。
常用场景
经典使用场景
在农业自动化领域,MinneApple数据集为果园环境下的苹果检测、分割与计数任务提供了标准化基准。该数据集通过提供高分辨率图像与多边形标注,支持研究者开发与评估计算机视觉算法,尤其在处理复杂光照条件、果实遮挡及多样外观等挑战时,成为验证模型鲁棒性的关键工具。其经典使用场景包括基于深度学习的果实检测网络训练、语义分割模型优化以及密集果实计数方法的性能对比,为精准农业中的视觉系统研究奠定了数据基础。
解决学术问题
MinneApple数据集解决了农业计算机视觉研究中缺乏统一基准的难题,使得不同检测与分割算法能在相同条件下进行公平比较。它通过提供大规模、多样化的标注实例,促进了小目标检测、密集场景分割及遮挡处理等学术问题的探索。该数据集的意义在于推动了精准农业领域方法论的标准化,为果实识别与产量估计的算法创新提供了可靠评估框架,从而加速了农业自动化技术的学术进展与实际应用转化。
衍生相关工作
MinneApple数据集衍生了一系列经典研究工作,例如基于Faster R-CNN和Mask R-CNN的果实检测框架优化,以及利用U-Net架构的语义分割方法改进。这些研究不仅提升了小目标果实识别的精度,还推动了针对遮挡与密集场景的算法创新。此外,该数据集启发了多篇关于果实计数与产量估计的学术论文,如结合高斯混合模型与卷积神经网络的混合方法,为农业视觉领域的后续研究提供了丰富的技术参考与比较基准。
以上内容由遇见数据集搜集并总结生成

社区讨论

【我遇到的问题】 • 现象:该数据集的下载链接已失效 【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作