Fruits-360

github2023-09-26 更新2024-05-31 收录

下载链接：

https://github.com/Chtchou/Fruit-Images-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

一个高质量的水果图像数据集，包含多种水果的图像，如苹果、香蕉、樱桃等，总计42345张图片，分为训练集和验证集，共有64个水果类别。

A high-quality fruit image dataset containing images of various fruits such as apples, bananas, cherries, etc., totaling 42,345 images, divided into training and validation sets, with a total of 64 fruit categories.

创建时间：

2018-06-15

原始信息汇总

数据集概述

数据集名称

Fruits-360

数据集来源

GitHub: Horea94/Fruit-Images-Dataset
Kaggle: moltean/fruits

数据集内容

包含多种水果的高质量图像，具体包括：

苹果（不同品种：Golden, Golden-Red, Granny Smith, Red, Red Delicious）
杏
鳄梨
成熟鳄梨
香蕉（黄色，红色）
仙人掌果
哈密瓜（2种）
星果
樱桃（不同品种，Rainier）
柑橘
椰子
枣
百香果
葡萄（粉色，白色，白色2）
葡萄柚（粉色，白色）
番石榴
越橘
猕猴桃
柿子
金桔
柠檬（普通，Meyer）
酸橙
荔枝
柑
芒果
百香果
油桃
橙子
木瓜
西番莲果
桃子
美洲南瓜
梨（不同品种，Abate, Monster, Williams）
菠萝
红龙果
李子
石榴
榅桲
覆盆子
蛇果
草莓
树番茄
蜜柑

数据集属性

总图像数：42345张
训练集大小：31688张图像
验证集大小：10657张图像
类别数：64种水果
图像尺寸：100x100像素
文件名格式：image_index_100.jpg 或 r_image_index_100.jpg 或 r2_image_index_100.jpg

数据集创建方法

使用Logitech C920摄像头拍摄，背景为白色纸张
通过专用算法（洪水填充算法）从非均匀背景中提取水果图像

数据集更新

数据集定期更新新水果种类，GitHub上提供了用于分类的特定版本数据集。

搜集汇总

数据集介绍

构建方式

Fruits-360数据集的构建过程采用了高度标准化的图像采集方法。研究人员将水果放置在低速电机的轴上，并使用Logitech C920摄像头录制了20秒的视频。为了确保背景的一致性，水果后方放置了白色纸张作为背景。然而，由于光照条件的变化，背景并不完全均匀，因此开发了一种基于洪水填充算法的专用算法，用于从背景中提取水果图像。该算法通过标记图像边缘的像素，并逐步扩展标记范围，最终将背景像素填充为白色，从而确保水果图像的清晰分离。

使用方法

Fruits-360数据集的使用方法主要基于fastai库，该库作为PyTorch的高级封装，简化了深度学习任务的实现流程。用户可以通过GitHub或Kaggle平台获取数据集，并按照训练集和验证集的文件夹结构加载数据。每个文件夹对应一种水果类别，便于分类任务的实施。数据集的版本管理确保了实验的可重复性，用户可以根据需求选择特定版本进行模型训练和验证。

背景与挑战

背景概述

Fruits-360数据集由Babes-Bolyai大学的Horea Muresan和Mihai Oltean于2017年创建，旨在通过深度学习技术实现水果图像的自动识别。该数据集包含了64种不同水果的图像，总计42,345张，其中训练集包含31,688张图像，验证集包含10,657张图像。每张图像的尺寸为100x100像素，且所有图像均以白色背景呈现。该数据集的构建过程采用了高精度的图像采集技术，并通过专门的算法处理背景，以确保图像质量。Fruits-360的发布为计算机视觉领域的水果识别研究提供了重要的数据支持，推动了相关算法的发展与应用。

当前挑战

Fruits-360数据集在解决水果图像分类问题时面临的主要挑战包括：1) 水果种类繁多且部分品种外观相似，导致分类模型在区分细微差异时容易出错；2) 图像采集过程中光照条件的变化可能导致背景不均匀，尽管采用了专门的背景提取算法，但仍可能影响模型的训练效果。在数据集构建过程中，研究人员还需应对水果旋转和拍摄角度变化带来的复杂性，以确保数据集的多样性和鲁棒性。此外，随着新水果种类的不断加入，数据集的扩展与维护也成为了一个持续的挑战。

常用场景

经典使用场景

Fruits-360数据集在计算机视觉领域中被广泛用于图像分类任务，尤其是水果识别。该数据集包含了64种不同水果的高质量图像，每张图像的分辨率为100x100像素，且背景为白色。研究人员通常使用该数据集来训练和验证深度学习模型，特别是卷积神经网络（CNN），以评估模型在复杂多类别分类任务中的性能。通过该数据集，研究者能够探索不同网络架构、优化算法和数据增强技术对分类精度的影响。

解决学术问题

Fruits-360数据集解决了水果图像分类中的多个学术研究问题。首先，它提供了一个标准化的基准数据集，使得不同研究团队能够在相同的条件下进行模型性能对比。其次，数据集中的图像经过精心处理，背景统一且水果种类多样，这为研究图像特征提取和分类算法提供了理想的环境。此外，数据集还包含了旋转和变形的图像，这有助于研究模型对图像变换的鲁棒性，从而推动计算机视觉领域的发展。

实际应用

Fruits-360数据集在实际应用中具有广泛的价值。例如，在农业自动化领域，该数据集可以用于开发智能水果分拣系统，帮助农民快速、准确地识别和分类不同种类的水果。此外，在零售行业，该数据集可以用于构建智能购物系统，帮助消费者通过图像识别技术快速找到所需的水果。这些应用不仅提高了生产效率，还改善了用户体验，展示了该数据集在现实世界中的巨大潜力。

数据集最近研究