FRUVEG67

Name: FRUVEG67
Creator: 印度理工学院焦特布尔计算机科学与工程系，FLAME大学计算与数据科学学院
Published: 2024-09-20 16:46:03
License: 暂无描述

arXiv2024-09-20 更新2024-09-26 收录

下载链接：

http://arxiv.org/abs/2409.13330v1

下载链接

链接失效反馈

官方服务：

资源简介：

FRUVEG67数据集由印度理工学院焦特布尔计算机科学与工程系和FLAME大学计算与数据科学学院共同创建，包含67类水果和蔬菜的图像，适用于非受控环境下的检测任务。该数据集共收集了5000张图像，其中2000张经过手动标注，其余图像通过半监督学习算法进行自动标注。数据集的创建旨在解决农业现代化中的水果和蔬菜检测问题，特别是在复杂和多样化的环境中。

The FRUVEG67 dataset was co-created by the Department of Computer Science and Engineering, Indian Institute of Technology Jodhpur, and the School of Computing and Data Sciences, FLAME University. It contains images of 67 categories of fruits and vegetables, suitable for detection tasks in uncontrolled environments. A total of 5000 images are collected in this dataset, among which 2000 were manually annotated, and the remaining images were automatically annotated via semi-supervised learning algorithms. The dataset is developed to address the problem of fruit and vegetable detection in agricultural modernization, especially in complex and diverse environments.

提供机构：

印度理工学院焦特布尔计算机科学与工程系，FLAME大学计算与数据科学学院

创建时间：

2024-09-20

搜集汇总

数据集介绍

构建方式

FRUVEG67数据集的构建过程融合了现实世界中水果和蔬菜检测的复杂性。该数据集包含了67种水果和蔬菜的图像，这些图像在不受约束的环境中拍摄，涵盖了多种光照条件、遮挡和背景杂乱的情况。为了确保数据集的多样性和实用性，研究团队从Flickr API收集了大量图像，并通过ResNet-52模型过滤掉非目标图像，最终保留了5000张图像。其中，约2000张图像进行了手动标注，其余图像则通过半监督数据标注算法（SSDA）进行自动标注。SSDA算法基于YOLOv7模型，通过迭代训练和推断，逐步生成高质量的标注数据，从而实现了数据集的高效构建。

使用方法

FRUVEG67数据集适用于多种计算机视觉任务，特别是水果和蔬菜的检测与定位。研究者可以利用该数据集训练和验证对象检测模型，如YOLO系列和Faster R-CNN等。在使用过程中，建议首先对数据进行预处理，包括图像尺寸标准化、像素值归一化和噪声去除等步骤，以提高模型的训练效果。随后，可以采用半监督学习算法（SSDA）对未标注图像进行自动标注，进一步扩充训练数据。在模型训练阶段，推荐使用FVDNet模型，该模型结合了YOLOv7的多个变体，通过集成学习和Jensen-Shannon散度损失函数，显著提升了检测精度。最终，通过评估模型在测试集上的表现，可以全面了解其在实际应用中的性能。

背景与挑战

背景概述

FRUVEG67数据集由印度理工学院焦特布尔分校和FLAME大学的研究人员于2024年创建，旨在提升在非受控环境中水果和蔬菜的检测能力。该数据集包含了67种水果和蔬菜的图像，这些图像在各种非受控场景中拍摄，每类仅有少量手动标注的样本。通过引入半监督数据标注算法（SSDA）和Fruit and Vegetable Detection Network（FVDNet），研究团队开发了一个端到端的检测和定位管道，显著提高了检测和定位性能。FRUVEG67数据集的创建填补了现代农业中数据集的空白，为农业现代化、提高效率、确保食品质量和推动可持续农业实践提供了技术支持。

当前挑战

FRUVEG67数据集面临的挑战主要集中在非受控环境中的对象检测问题，如光照变化、遮挡、背景杂乱以及形状、大小和颜色的多样性。构建过程中，手动标注图像的复杂性和缺乏视觉参考增加了标注难度。此外，数据集的多样性和复杂性要求模型能够处理多对象、遮挡和背景杂乱的情况。为了应对这些挑战，研究团队采用了半监督学习算法（SSDA）和集成学习方法，通过引入Jensen-Shannon散度（JSD）和焦点损失来提升小对象的检测精度。尽管如此，模型在处理极小对象和高度杂乱环境时仍面临显著挑战。

常用场景

经典使用场景

FRUVEG67数据集在现代农业中具有重要应用，特别是在水果和蔬菜的检测与定位方面。该数据集包含67类水果和蔬菜的图像，这些图像在非受控环境中拍摄，具有光照变化、遮挡和背景杂乱等特点。通过使用FRUVEG67数据集，研究人员可以开发和验证在复杂环境中进行高效、准确检测的算法，这对于农业自动化、产量估计和食品质量保证具有重要意义。

解决学术问题

FRUVEG67数据集解决了在非受控环境中水果和蔬菜检测的学术研究问题。传统的检测方法在受控环境下表现良好，但在复杂环境中效果不佳。FRUVEG67通过提供多样化的图像数据，帮助研究人员开发能够在光照变化、遮挡和背景杂乱等条件下有效工作的检测算法。这不仅提升了检测精度，还推动了计算机视觉技术在农业领域的应用，具有重要的学术价值和实际意义。

实际应用

FRUVEG67数据集在实际应用中具有广泛的前景，特别是在农业自动化和食品加工行业。通过使用该数据集训练的模型，可以实现水果和蔬菜的自动分拣、包装和质量检测，提高生产效率和产品质量。此外，在精准农业中，该数据集可用于监测作物健康、病害检测和资源优化，帮助农民做出更科学的种植决策，从而提高农业生产的可持续性和经济效益。

数据集最近研究