Fruits 360
收藏github2021-12-10 更新2024-05-31 收录
下载链接:
https://github.com/Dethekar/apples-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含水果、蔬菜和坚果的图像,图像大小可变,每个图像中包含一个水果或蔬菜。数据集分为训练、验证和测试三个子集,每个子集包含不同比例的图像。此外,还提供了关于每个对象的额外信息,如类型、大小、成熟度状态等。
This dataset contains images of fruits, vegetables, and nuts, with variable image sizes, where each image exclusively features one fruit, vegetable, or nut. The dataset is divided into three subsets: training, validation, and test, each holding a separate proportional share of the total image corpus. Additionally, supplementary metadata for each object is provided, including its category, physical size, maturity status, and other related attributes.
创建时间:
2021-12-10
原始信息汇总
数据集概述
数据集名称
Fruits-360
数据集内容
包含水果、蔬菜和坚果的图像,图像尺寸为原始拍摄大小,不同于之前版本的100x100像素尺寸。
数据集版本
2021.09.12.0
数据集属性
- 图像总数:待定
- 训练集大小:待定(每张图像一个水果或蔬菜)
- 测试集大小:待定(每张图像一个水果或蔬菜)
- 类别数:待定(水果和蔬菜)
- 图像尺寸:可变
- 文件名格式:r?_image_index.jpg(例如:r0_31.jpg或r1_12.jpg)
数据集结构
- 图像分组:分为训练集、验证集和测试集。
- 训练集:约50%的图像
- 验证集和测试集:各约25%的图像
- 元数据:包含关于数据集中对象的额外信息,如类型、大小、成熟度状态、水分含量、果糖含量、生长地点等。
数据集创建方法
- 使用Logitech C920摄像头拍摄,背景为白色纸张。
- 使用特定算法(洪水填充类型)从背景中提取水果图像。
数据集分割规则
- 图像根据对象索引
k进行分割,规则如下:k,k + 2→ 训练集k + 1→ 验证集k + 3→ 测试集k是对象的索引,且为4的倍数。
许可证
MIT License
版权信息
Copyright (c) 2017-2021 Mihai Oltean
搜集汇总
数据集介绍

构建方式
Fruits 360数据集的构建过程采用了高精度的图像采集技术。水果和蔬菜被放置在低速电机的轴上,通过Logitech C920摄像头进行拍摄,每段视频持续20秒。为了确保背景的一致性,拍摄时使用了白色纸张作为背景。然而,由于光照条件的变化,背景并不完全均匀,因此开发了一种基于洪水填充算法的专用算法,用于从背景中提取水果。该算法通过标记图像边缘的像素,并逐步扩展到颜色差异小于预设值的邻近像素,最终将背景像素填充为白色,保留水果部分的像素。
特点
Fruits 360数据集的特点在于其图像的高分辨率和多样性。数据集中的图像以原始尺寸呈现,与之前100x100像素的版本不同,提供了更丰富的细节信息。数据集包含多种水果和蔬菜的图像,每种水果或蔬菜被存储为独立的对象,即使属于同一品种也会被区分。此外,数据集还提供了每个对象的元信息,如类型、大小、成熟度、水分含量、果糖含量和生长地点等,为研究提供了多维度的支持。
使用方法
Fruits 360数据集的使用方法较为灵活,适用于多种机器学习任务。数据集被划分为训练集、验证集和测试集,分别包含约50%、25%和25%的图像。用户可以根据需要加载特定子集进行模型训练和评估。数据集的图像文件名格式为r?_image_index.jpg,其中r?表示旋转轴,便于区分不同角度的图像。此外,数据集提供了详细的元信息,用户可以通过这些信息进行更深入的分析和实验。
背景与挑战
背景概述
Fruits 360数据集由Mihai Oltean于2017年创建,旨在为计算机视觉领域提供高质量的水果和蔬菜图像数据。该数据集通过低速电机旋转水果并拍摄视频,使用Logitech C920摄像头记录图像,并通过专用算法提取背景,确保图像质量。数据集包含多种水果和蔬菜的图像,每张图像均标注了详细的元数据,如类型、大小、成熟度等。Fruits 360在图像分类、目标检测等领域具有重要影响力,为相关研究提供了丰富的实验数据。
当前挑战
Fruits 360数据集在构建过程中面临多重挑战。首先,由于光照条件的变化,背景提取算法的设计需要极高的精度,以确保水果与背景的清晰分离。其次,数据集的规模庞大,图像数量尚未完全确定,这为数据管理和存储带来了复杂性。此外,不同种类水果的形态和颜色差异显著,增加了分类模型的训练难度。尽管数据集在图像质量和多样性方面表现出色,但其构建过程仍需克服技术难题,以进一步提升数据的可用性和研究价值。
常用场景
经典使用场景
Fruits 360数据集广泛应用于计算机视觉领域,特别是在图像分类和物体识别任务中。由于其包含了多种水果和蔬菜的高质量图像,研究人员可以利用该数据集训练深度学习模型,以识别和分类不同种类的水果和蔬菜。该数据集还为图像分割和特征提取等任务提供了丰富的素材。
解决学术问题
Fruits 360数据集解决了计算机视觉领域中的多个关键问题,尤其是在小样本学习和多类别分类任务中。通过提供大量标注清晰的图像,该数据集帮助研究人员克服了数据不足的挑战,推动了图像识别算法的进步。此外,数据集中的背景去除算法也为图像预处理技术提供了新的研究方向。
衍生相关工作
Fruits 360数据集衍生了许多经典的研究工作,特别是在深度学习模型的优化和应用方面。例如,基于该数据集的研究提出了多种改进的卷积神经网络(CNN)架构,用于提升图像分类的准确率。此外,该数据集还被用于开发轻量级模型,以在资源受限的设备上实现高效的图像识别。
以上内容由遇见数据集搜集并总结生成



