Fruits-360
收藏github2024-05-19 更新2024-05-31 收录
下载链接:
https://github.com/Horea94/Fruit-Images-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
一个高质量的水果和蔬菜图像数据集,包含131种不同的水果和蔬菜,总计90483张图片,每张图片展示一种水果或蔬菜。数据集分为训练集和测试集,以及包含多个水果的图片集。图像大小为100x100像素。
A high-quality dataset of fruit and vegetable images, encompassing 131 distinct varieties, totaling 90,483 images, each depicting a single fruit or vegetable. The dataset is partitioned into training and test sets, along with a collection of images featuring multiple fruits. Each image is sized at 100x100 pixels.
创建时间:
2017-05-06
原始信息汇总
数据集概述
数据集名称
Fruits-360: 包含水果和蔬菜的图像数据集
版本
2020.05.18.0
包含内容
数据集包含多种水果和蔬菜的图像,具体包括:
- 苹果(不同品种)
- 杏
- 鳄梨
- 香蕉(不同颜色)
- 甜菜根
- 蓝莓
- 仙人掌果实
- 哈密瓜(两种品种)
- 星果
- 花椰菜
- 樱桃(不同品种)
- 樱桃蜡(不同颜色)
- 栗子
- 柑橘
- 椰子
- 玉米(带壳)
- 黄瓜(成熟)
- 日期
- 茄子
- 无花果
- 姜根
- 西番莲
- 葡萄(不同颜色和品种)
- 葡萄柚(不同颜色)
- 番石榴
- 榛子
- 越橘
- 猕猴桃
- 柿子
- 大头菜
- 金橘
- 柠檬(普通和Meyer品种)
- 酸橙
- 荔枝
- 柑橘
- 芒果(不同颜色)
- 山竹
- 百香果
- 青蛙皮瓜
- 桑葚
- 油桃(常规和平)
- 坚果(森林和山核桃)
- 洋葱(红和白)
- 橙子
- 木瓜
- 西番莲果
- 桃子(不同品种)
- 美洲南瓜
- 梨(不同品种)
- 辣椒(不同颜色)
- 灯笼果(普通和带壳)
- 菠萝(普通和迷你)
- 红龙果
- 李子(不同品种)
- 石榴
- 甜柚
- 土豆(红、甜、白)
- 榅桲
- 红毛丹
- 覆盆子
- 红加仑
- 蛇果
- 草莓(普通和楔形)
- 树番茄
- 蜜柑
- 西红柿(不同品种)
- 核桃
- 西瓜
数据集属性
- 总图像数:90483
- 训练集大小:67692图像(每张图像一个水果或蔬菜)
- 测试集大小:22688图像(每张图像一个水果或蔬菜)
- 多水果集大小:103图像(每张图像包含多个水果或水果类别)
- 类别数:131(水果和蔬菜)
- 图像大小:100x100像素
- 文件名格式:image_index_100.jpg 或 r_image_index_100.jpg 或 r2_image_index_100.jpg 或 r3_image_index_100.jpg("r"表示水果旋转,"r2"表示水果绕第三轴旋转)
存储结构
- 训练和测试图像分别存储在Training和Test文件夹中。
- 包含多个水果的图像存储在test-multiple_fruits文件夹中。
- 用于训练神经网络的Python代码存储在src/image_classification和src/image_classification_tf_1.8.0文件夹中。
- 用于从背景中提取水果或蔬菜的C++代码存储在src/utils文件夹中。
- 相关研究论文存储在papers文件夹中。
许可证
MIT License
版权所有 (c) 2017-2020 Mihai Oltean, Horea Muresan
搜集汇总
数据集介绍

构建方式
Fruits-360数据集通过在低速电机(3 rpm)的轴上种植水果和蔬菜,并使用Logitech C920摄像头录制20秒的视频来构建。视频中的水果和蔬菜背景为白色纸张,但由于光照条件的变化,背景并非均匀。为此,开发了一种基于洪水填充算法的专用算法,用于从背景中提取水果。该算法从图像的边缘开始,标记所有像素,然后标记邻近已标记像素且颜色距离小于预定值的像素,重复此过程直至无法再标记更多像素。所有标记的像素被视为背景(填充为白色),其余像素则被视为属于对象。
特点
Fruits-360数据集具有以下特点:包含131个类别的水果和蔬菜,总图像数为90483张,其中训练集67692张,测试集22688张,多水果图像集103张。图像尺寸为100x100像素,文件名格式标准化,便于识别和处理。不同品种的同种水果被归类为不同类别,增强了数据集的多样性和复杂性。此外,数据集还包括旋转和多水果图像,模拟真实世界中的检测场景,提升了数据集的应用价值。
使用方法
Fruits-360数据集适用于图像分类和对象检测任务。用户可以通过下载GitHub或Kaggle上的数据集文件,解压后访问训练和测试图像。数据集结构清晰,包含训练集、测试集和多水果测试集,便于直接用于模型训练和评估。提供的Python代码示例使用TensorFlow 2.0和1.8.0库进行神经网络训练,用户可根据需要选择合适的版本进行实验。此外,数据集还附带了C++代码用于背景提取,进一步支持自定义数据处理和模型开发。
背景与挑战
背景概述
Fruits-360数据集是由Horea Muresan和Mihai Oltean于2017年至2020年间创建的高质量图像数据集,专注于水果和蔬菜的图像识别。该数据集包含了131种不同的水果和蔬菜,每种水果和蔬菜都有多个品种,总计90483张图像。这些图像通过低速电机旋转拍摄,确保了不同角度和光照条件下的多样性。Fruits-360数据集的核心研究问题是如何通过深度学习技术准确识别和分类这些水果和蔬菜,这对于农业自动化、食品质量控制等领域具有重要意义。
当前挑战
Fruits-360数据集在构建过程中面临了多个挑战。首先,由于拍摄环境的光照条件变化,背景不均匀,研究人员开发了专门的算法来提取水果和蔬菜的图像。其次,数据集中包含了多种水果和蔬菜的多个品种,这增加了分类任务的复杂性。此外,数据集中的多水果图像(test-multiple_fruits)部分,由于水果之间的遮挡和重叠,进一步增加了识别的难度。这些挑战使得Fruits-360数据集在图像分类和目标检测领域具有重要的研究价值。
常用场景
经典使用场景
在计算机视觉领域,Fruits-360数据集被广泛用于图像分类和对象识别任务。其高分辨率的图像和多样化的水果与蔬菜类别,为研究人员提供了一个理想的平台,用于训练和评估深度学习模型。通过该数据集,研究者可以探索不同品种水果的特征提取和分类算法,从而提升模型在实际应用中的准确性和鲁棒性。
实际应用
在实际应用中,Fruits-360数据集被用于开发智能农业系统和食品质量检测系统。例如,通过训练基于该数据集的深度学习模型,可以实现自动化的水果分类和成熟度检测,从而提高农业生产的效率和质量控制。此外,该数据集还可用于零售行业的自动结账系统,通过图像识别技术快速准确地识别和分类水果与蔬菜。
衍生相关工作
基于Fruits-360数据集,许多研究工作得以展开,包括但不限于图像增强技术、多标签分类算法和实时检测系统。例如,有研究利用该数据集开发了基于卷积神经网络(CNN)的水果识别模型,显著提高了识别精度。此外,还有研究探讨了如何利用迁移学习技术,将该数据集应用于其他类似的图像分类任务,进一步扩展了其应用范围。
以上内容由遇见数据集搜集并总结生成



