Fruits-360
收藏github2023-09-26 更新2024-05-31 收录
下载链接:
https://github.com/Chtchou/Fruit-Images-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。
A high-quality fruit image dataset containing images of various fruits such as apples, bananas, cherries, etc., totaling 42,345 images, divided into training and validation sets, with a total of 64 fruit categories.
创建时间:
2018-06-15
原始信息汇总
数据集概述
数据集名称
Fruits-360
数据集来源
- GitHub: Horea94/Fruit-Images-Dataset
- Kaggle: moltean/fruits
数据集内容
包含多种水果的高质量图像,具体包括:
- 苹果(不同品种:Golden, Golden-Red, Granny Smith, Red, Red Delicious)
- 杏
- 鳄梨
- 成熟鳄梨
- 香蕉(黄色,红色)
- 仙人掌果
- 哈密瓜(2种)
- 星果
- 樱桃(不同品种,Rainier)
- 柑橘
- 椰子
- 枣
- 百香果
- 葡萄(粉色,白色,白色2)
- 葡萄柚(粉色,白色)
- 番石榴
- 越橘
- 猕猴桃
- 柿子
- 金桔
- 柠檬(普通,Meyer)
- 酸橙
- 荔枝
- 柑
- 芒果
- 百香果
- 油桃
- 橙子
- 木瓜
- 西番莲果
- 桃子
- 美洲南瓜
- 梨(不同品种,Abate, Monster, Williams)
- 菠萝
- 红龙果
- 李子
- 石榴
- 榅桲
- 覆盆子
- 蛇果
- 草莓
- 树番茄
- 蜜柑
数据集属性
- 总图像数:42345张
- 训练集大小:31688张图像
- 验证集大小:10657张图像
- 类别数:64种水果
- 图像尺寸:100x100像素
- 文件名格式:image_index_100.jpg 或 r_image_index_100.jpg 或 r2_image_index_100.jpg
数据集创建方法
- 使用Logitech C920摄像头拍摄,背景为白色纸张
- 通过专用算法(洪水填充算法)从非均匀背景中提取水果图像
数据集更新
数据集定期更新新水果种类,GitHub上提供了用于分类的特定版本数据集。
搜集汇总
数据集介绍

构建方式
Fruits-360数据集的构建过程采用了高度标准化的图像采集方法。研究人员将水果放置在低速电机的轴上,并使用Logitech C920摄像头录制了20秒的视频。为了确保背景的一致性,水果后方放置了白色纸张作为背景。然而,由于光照条件的变化,背景并不完全均匀,因此开发了一种基于洪水填充算法的专用算法,用于从背景中提取水果图像。该算法通过标记图像边缘的像素,并逐步扩展标记范围,最终将背景像素填充为白色,从而确保水果图像的清晰分离。
使用方法
Fruits-360数据集的使用方法主要基于fastai库,该库作为PyTorch的高级封装,简化了深度学习任务的实现流程。用户可以通过GitHub或Kaggle平台获取数据集,并按照训练集和验证集的文件夹结构加载数据。每个文件夹对应一种水果类别,便于分类任务的实施。数据集的版本管理确保了实验的可重复性,用户可以根据需求选择特定版本进行模型训练和验证。
背景与挑战
背景概述
Fruits-360数据集由Babes-Bolyai大学的Horea Muresan和Mihai Oltean于2017年创建,旨在通过深度学习技术实现水果图像的自动识别。该数据集包含了64种不同水果的图像,总计42,345张,其中训练集包含31,688张图像,验证集包含10,657张图像。每张图像的尺寸为100x100像素,且所有图像均以白色背景呈现。该数据集的构建过程采用了高精度的图像采集技术,并通过专门的算法处理背景,以确保图像质量。Fruits-360的发布为计算机视觉领域的水果识别研究提供了重要的数据支持,推动了相关算法的发展与应用。
当前挑战
Fruits-360数据集在解决水果图像分类问题时面临的主要挑战包括:1) 水果种类繁多且部分品种外观相似,导致分类模型在区分细微差异时容易出错;2) 图像采集过程中光照条件的变化可能导致背景不均匀,尽管采用了专门的背景提取算法,但仍可能影响模型的训练效果。在数据集构建过程中,研究人员还需应对水果旋转和拍摄角度变化带来的复杂性,以确保数据集的多样性和鲁棒性。此外,随着新水果种类的不断加入,数据集的扩展与维护也成为了一个持续的挑战。
常用场景
经典使用场景
Fruits-360数据集在计算机视觉领域中被广泛用于图像分类任务,尤其是水果识别。该数据集包含了64种不同水果的高质量图像,每张图像的分辨率为100x100像素,且背景为白色。研究人员通常使用该数据集来训练和验证深度学习模型,特别是卷积神经网络(CNN),以评估模型在复杂多类别分类任务中的性能。通过该数据集,研究者能够探索不同网络架构、优化算法和数据增强技术对分类精度的影响。
解决学术问题
Fruits-360数据集解决了水果图像分类中的多个学术研究问题。首先,它提供了一个标准化的基准数据集,使得不同研究团队能够在相同的条件下进行模型性能对比。其次,数据集中的图像经过精心处理,背景统一且水果种类多样,这为研究图像特征提取和分类算法提供了理想的环境。此外,数据集还包含了旋转和变形的图像,这有助于研究模型对图像变换的鲁棒性,从而推动计算机视觉领域的发展。
实际应用
Fruits-360数据集在实际应用中具有广泛的价值。例如,在农业自动化领域,该数据集可以用于开发智能水果分拣系统,帮助农民快速、准确地识别和分类不同种类的水果。此外,在零售行业,该数据集可以用于构建智能购物系统,帮助消费者通过图像识别技术快速找到所需的水果。这些应用不仅提高了生产效率,还改善了用户体验,展示了该数据集在现实世界中的巨大潜力。
数据集最近研究
最新研究方向
近年来,Fruits-360数据集在计算机视觉和深度学习领域的研究中占据了重要地位,尤其是在水果识别和分类任务中。随着深度学习技术的快速发展,研究者们利用该数据集探索了多种先进的神经网络架构,如卷积神经网络(CNN)和迁移学习模型,以提高水果识别的准确性和鲁棒性。特别是在农业自动化和智能零售领域,Fruits-360数据集的应用为自动化水果分拣系统和智能购物车等创新解决方案提供了坚实的数据基础。此外,该数据集的持续更新和扩展,使得研究者能够不断验证和改进模型在新水果类别上的泛化能力,推动了水果识别技术的进一步发展。
以上内容由遇见数据集搜集并总结生成



