five

自定义数据集(论文中未提及具体名称)

收藏
arXiv2025-04-18 更新2025-04-22 收录
下载链接:
http://arxiv.org/abs/2504.13099v1
下载链接
链接失效反馈
官方服务:
资源简介:
该自定义数据集由康奈尔大学和堪萨斯州立大学的研究人员开发,包含在复杂果园环境下拍摄的857张真实场图像。图像采集于华盛顿州普罗瑟的一个商业果园,这些图像的特点是未成熟的绿色果实与绿色树冠背景颜色相似,导致检测中存在显著的遮挡和视觉混淆问题。数据集用于评估RF-DETR和YOLOv12模型在单类和多类绿色果实检测任务中的性能,这些任务对于精确农业中的自动化监测和采摘具有重要意义。

This custom dataset was developed by researchers from Cornell University and Kansas State University, consisting of 857 real-field images captured in complex orchard environments. The images were collected in a commercial orchard in Prosser, Washington State. A notable feature of these images is that unripe green fruits exhibit similar color to the green canopy background, which causes severe occlusion and visual confusion challenges during detection. This dataset is utilized to assess the performance of RF-DETR and YOLOv12 models on single-class and multi-class green fruit detection tasks, which are critical for automated monitoring and harvesting in precision agriculture.
提供机构:
康奈尔大学生物与环境工程系, 堪萨斯州立大学生物与农业工程系
创建时间:
2025-04-18
搜集汇总
数据集介绍
main_image_url
构建方式
该自定义数据集构建于复杂的果园环境中,旨在评估RF-DETR和YOLOv12模型在单类(绿色果实)和多类(遮挡与非遮挡绿色果实)检测任务中的表现。数据采集采用配备Intel RealSense D435i相机的机器人平台,在华盛顿州Prosser的商业苹果园中捕获了857张高分辨率RGB图像。通过Roboflow平台进行手动标注,单类数据集包含4,125个标注实例,多类数据集则根据果实可见度(≥90%表面可见为非遮挡,否则为遮挡)进一步细分。标注过程中特别处理了因簇集、光照阴影或枝叶重叠导致的标签模糊性问题,确保数据能真实反映果园场景的视觉复杂性。
使用方法
该数据集支持两种典型应用范式:1) 模型对比研究,如论文中统一采用640×640分辨率输入,以相同超参数(学习率1e-4, batch size 16)训练RF-DETR(Base版)和YOLOv12各变体,通过mAP@50/50:95等指标系统评估性能差异;2) 农业视觉任务迁移,建议使用时进行数据增强(如Mosaic9增强、HSV颜色扰动)以提升模型对光照变化的鲁棒性。对于遮挡分析任务,可提取多类数据集中的遮挡比例特征与检测置信度的相关性。数据集已按7:2:1划分训练/验证/测试集,确保评估结果可靠性。
背景与挑战
背景概述
该数据集由Cornell University和Kansas State University的研究团队于2024年创建,专注于复杂果园环境中的绿色果实检测。作为深度学习在精准农业领域的重要应用,该数据集通过采集'Scifresh'苹果树的857张RGB-D图像,构建了包含单类别(绿色果实)和多类别(遮挡/非遮挡果实)标注的样本库。其创新性体现在针对农业场景特有的标签模糊性问题,系统性地标注了4125个果实实例,为比较Transformer-based(RF-DETR)和CNN-based(YOLOv12)目标检测架构提供了基准测试平台。该研究通过mAP@50等指标验证了RF-DETR在遮挡场景下0.9464的优异表现,推动了农业视觉检测技术从传统特征提取向端到端学习的范式转变。
当前挑战
该数据集主要解决农业场景中因果实遮挡、背景伪装和光照变化导致的检测难题。具体挑战包括:1) 领域问题方面,需克服颜色相似性(绿色果实与叶丛的LAB色差仅ΔE<5)、小目标检测(果实平均像素面积<0.1%图像面积)及动态遮挡(平均每图像2.3个遮挡实例)等核心问题;2) 构建过程中面临多模态数据对齐(RGB与深度图时空同步误差<3ms)、标签歧义处理(约12.7%边界案例需专家复核)以及真实场景复现(模拟8种自然光照条件)等技术难点。这些挑战推动了新型注意力机制和域适应算法在农业视觉领域的发展。
常用场景
经典使用场景
在复杂果园环境中,绿色果实的检测一直是农业自动化领域的重要挑战。该数据集通过标注单类别(绿色果实)和多类别(遮挡与非遮挡绿色果实)的果实图像,为研究基于Transformer和CNN的物体检测模型提供了丰富的实验材料。特别是在果实被树叶遮挡或与背景颜色相似的复杂场景下,该数据集能够有效评估模型在真实环境中的表现。
解决学术问题
该数据集解决了农业视觉检测中的多个关键学术问题,包括标签模糊性、部分遮挡和背景伪装。通过提供精确的标注数据,研究人员可以深入分析RF-DETR和YOLOv12等模型在不同条件下的性能差异,从而推动物体检测算法在复杂环境中的优化。此外,数据集还为模型训练的动态收敛性和多类别分类能力提供了实证基础。
实际应用
在实际应用中,该数据集为果园自动化管理提供了重要支持。例如,通过检测未成熟的绿色果实,农民可以更准确地进行早期产量估计和疏果操作。此外,数据集还可用于开发机器人采摘系统,提高采摘效率并减少人工成本。其多类别标注进一步帮助区分遮挡果实,优化农业机器人在复杂环境中的作业能力。
数据集最近研究
最新研究方向
近年来,基于Transformer和CNN架构的目标检测模型在农业复杂环境中的应用成为研究热点。论文中提出的RF-DETR和YOLOv12模型在果园环境中对绿色果实的检测表现进行了全面比较。RF-DETR凭借其基于DINOv2主干的变形注意力机制,在全局上下文建模方面表现优异,尤其适用于部分遮挡或视觉模糊的果实检测。而YOLOv12则通过CNN的注意力机制优化了局部特征提取,更适合计算效率高和边缘部署的场景。研究结果表明,RF-DETR在单类检测中达到了0.9464的平均精度(mAP@50),展现了其在复杂空间场景中的强大能力。在多类检测中,RF-DETR同样以0.8298的mAP@50领先,证明了其在区分遮挡和非遮挡果实方面的有效性。这一研究不仅推动了农业自动化中目标检测技术的发展,也为复杂环境下的实时检测提供了新的解决方案。
相关研究论文
  • 1
    RF-DETR Object Detection vs YOLOv12 : A Study of Transformer-based and CNN-based Architectures for Single-Class and Multi-Class Greenfruit Detection in Complex Orchard Environments Under Label Ambiguity康奈尔大学生物与环境工程系, 堪萨斯州立大学生物与农业工程系 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作