自定义数据集（论文中未提及具体名称）

Name: 自定义数据集（论文中未提及具体名称）
Creator: 康奈尔大学生物与环境工程系, 堪萨斯州立大学生物与农业工程系
Published: 2025-04-18 01:08:11
License: 暂无描述

arXiv2025-04-18 更新2025-04-22 收录

下载链接：

http://arxiv.org/abs/2504.13099v1

下载链接

链接失效反馈

官方服务：

资源简介：

该自定义数据集由康奈尔大学和堪萨斯州立大学的研究人员开发，包含在复杂果园环境下拍摄的857张真实场图像。图像采集于华盛顿州普罗瑟的一个商业果园，这些图像的特点是未成熟的绿色果实与绿色树冠背景颜色相似，导致检测中存在显著的遮挡和视觉混淆问题。数据集用于评估RF-DETR和YOLOv12模型在单类和多类绿色果实检测任务中的性能，这些任务对于精确农业中的自动化监测和采摘具有重要意义。

This custom dataset was developed by researchers from Cornell University and Kansas State University, consisting of 857 real-field images captured in complex orchard environments. The images were collected in a commercial orchard in Prosser, Washington State. A notable feature of these images is that unripe green fruits exhibit similar color to the green canopy background, which causes severe occlusion and visual confusion challenges during detection. This dataset is utilized to assess the performance of RF-DETR and YOLOv12 models on single-class and multi-class green fruit detection tasks, which are critical for automated monitoring and harvesting in precision agriculture.

提供机构：

康奈尔大学生物与环境工程系, 堪萨斯州立大学生物与农业工程系

创建时间：

2025-04-18

搜集汇总

数据集介绍

构建方式

该自定义数据集构建于复杂的果园环境中，旨在评估RF-DETR和YOLOv12模型在单类（绿色果实）和多类（遮挡与非遮挡绿色果实）检测任务中的表现。数据采集采用配备Intel RealSense D435i相机的机器人平台，在华盛顿州Prosser的商业苹果园中捕获了857张高分辨率RGB图像。通过Roboflow平台进行手动标注，单类数据集包含4,125个标注实例，多类数据集则根据果实可见度（≥90%表面可见为非遮挡，否则为遮挡）进一步细分。标注过程中特别处理了因簇集、光照阴影或枝叶重叠导致的标签模糊性问题，确保数据能真实反映果园场景的视觉复杂性。

使用方法

该数据集支持两种典型应用范式：1) 模型对比研究，如论文中统一采用640×640分辨率输入，以相同超参数（学习率1e-4, batch size 16）训练RF-DETR（Base版）和YOLOv12各变体，通过mAP@50/50:95等指标系统评估性能差异；2) 农业视觉任务迁移，建议使用时进行数据增强（如Mosaic9增强、HSV颜色扰动）以提升模型对光照变化的鲁棒性。对于遮挡分析任务，可提取多类数据集中的遮挡比例特征与检测置信度的相关性。数据集已按7:2:1划分训练/验证/测试集，确保评估结果可靠性。

背景与挑战

背景概述

该数据集由Cornell University和Kansas State University的研究团队于2024年创建，专注于复杂果园环境中的绿色果实检测。作为深度学习在精准农业领域的重要应用，该数据集通过采集'Scifresh'苹果树的857张RGB-D图像，构建了包含单类别（绿色果实）和多类别（遮挡/非遮挡果实）标注的样本库。其创新性体现在针对农业场景特有的标签模糊性问题，系统性地标注了4125个果实实例，为比较Transformer-based（RF-DETR）和CNN-based（YOLOv12）目标检测架构提供了基准测试平台。该研究通过mAP@50等指标验证了RF-DETR在遮挡场景下0.9464的优异表现，推动了农业视觉检测技术从传统特征提取向端到端学习的范式转变。

当前挑战

该数据集主要解决农业场景中因果实遮挡、背景伪装和光照变化导致的检测难题。具体挑战包括：1) 领域问题方面，需克服颜色相似性（绿色果实与叶丛的LAB色差仅ΔE<5）、小目标检测（果实平均像素面积<0.1%图像面积）及动态遮挡（平均每图像2.3个遮挡实例）等核心问题；2) 构建过程中面临多模态数据对齐（RGB与深度图时空同步误差<3ms）、标签歧义处理（约12.7%边界案例需专家复核）以及真实场景复现（模拟8种自然光照条件）等技术难点。这些挑战推动了新型注意力机制和域适应算法在农业视觉领域的发展。

常用场景

经典使用场景

在复杂果园环境中，绿色果实的检测一直是农业自动化领域的重要挑战。该数据集通过标注单类别（绿色果实）和多类别（遮挡与非遮挡绿色果实）的果实图像，为研究基于Transformer和CNN的物体检测模型提供了丰富的实验材料。特别是在果实被树叶遮挡或与背景颜色相似的复杂场景下，该数据集能够有效评估模型在真实环境中的表现。

解决学术问题

该数据集解决了农业视觉检测中的多个关键学术问题，包括标签模糊性、部分遮挡和背景伪装。通过提供精确的标注数据，研究人员可以深入分析RF-DETR和YOLOv12等模型在不同条件下的性能差异，从而推动物体检测算法在复杂环境中的优化。此外，数据集还为模型训练的动态收敛性和多类别分类能力提供了实证基础。

实际应用

在实际应用中，该数据集为果园自动化管理提供了重要支持。例如，通过检测未成熟的绿色果实，农民可以更准确地进行早期产量估计和疏果操作。此外，数据集还可用于开发机器人采摘系统，提高采摘效率并减少人工成本。其多类别标注进一步帮助区分遮挡果实，优化农业机器人在复杂环境中的作业能力。

数据集最近研究