five

Fruits 360

收藏
github2021-12-10 更新2024-05-31 收录
下载链接:
https://github.com/Dethekar/apples-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含水果、蔬菜和坚果的图像,图像大小可变,每个图像中包含一个水果或蔬菜。数据集分为训练、验证和测试三个子集,每个子集包含不同比例的图像。此外,还提供了关于每个对象的额外信息,如类型、大小、成熟度状态等。

This dataset contains images of fruits, vegetables, and nuts, with variable image sizes, where each image exclusively features one fruit, vegetable, or nut. The dataset is divided into three subsets: training, validation, and test, each holding a separate proportional share of the total image corpus. Additionally, supplementary metadata for each object is provided, including its category, physical size, maturity status, and other related attributes.
创建时间:
2021-12-10
原始信息汇总

数据集概述

数据集名称

Fruits-360

数据集内容

包含水果、蔬菜和坚果的图像,图像尺寸为原始拍摄大小,不同于之前版本的100x100像素尺寸。

数据集版本

2021.09.12.0

数据集属性

  • 图像总数:待定
  • 训练集大小:待定(每张图像一个水果或蔬菜)
  • 测试集大小:待定(每张图像一个水果或蔬菜)
  • 类别数:待定(水果和蔬菜)
  • 图像尺寸:可变
  • 文件名格式:r?_image_index.jpg(例如:r0_31.jpg或r1_12.jpg)

数据集结构

  • 图像分组:分为训练集、验证集和测试集。
    • 训练集:约50%的图像
    • 验证集和测试集:各约25%的图像
  • 元数据:包含关于数据集中对象的额外信息,如类型、大小、成熟度状态、水分含量、果糖含量、生长地点等。

数据集创建方法

  • 使用Logitech C920摄像头拍摄,背景为白色纸张。
  • 使用特定算法(洪水填充类型)从背景中提取水果图像。

数据集分割规则

  • 图像根据对象索引k进行分割,规则如下:
    • k, k + 2 → 训练集
    • k + 1 → 验证集
    • k + 3 → 测试集
    • k 是对象的索引,且为4的倍数。

许可证

MIT License

版权信息

Copyright (c) 2017-2021 Mihai Oltean

搜集汇总
数据集介绍
main_image_url
构建方式
Fruits 360数据集的构建过程采用了高精度的图像采集技术。水果和蔬菜被放置在低速电机的轴上,通过Logitech C920摄像头进行拍摄,每段视频持续20秒。为了确保背景的一致性,拍摄时使用了白色纸张作为背景。然而,由于光照条件的变化,背景并不完全均匀,因此开发了一种基于洪水填充算法的专用算法,用于从背景中提取水果。该算法通过标记图像边缘的像素,并逐步扩展到颜色差异小于预设值的邻近像素,最终将背景像素填充为白色,保留水果部分的像素。
特点
Fruits 360数据集的特点在于其图像的高分辨率和多样性。数据集中的图像以原始尺寸呈现,与之前100x100像素的版本不同,提供了更丰富的细节信息。数据集包含多种水果和蔬菜的图像,每种水果或蔬菜被存储为独立的对象,即使属于同一品种也会被区分。此外,数据集还提供了每个对象的元信息,如类型、大小、成熟度、水分含量、果糖含量和生长地点等,为研究提供了多维度的支持。
使用方法
Fruits 360数据集的使用方法较为灵活,适用于多种机器学习任务。数据集被划分为训练集、验证集和测试集,分别包含约50%、25%和25%的图像。用户可以根据需要加载特定子集进行模型训练和评估。数据集的图像文件名格式为r?_image_index.jpg,其中r?表示旋转轴,便于区分不同角度的图像。此外,数据集提供了详细的元信息,用户可以通过这些信息进行更深入的分析和实验。
背景与挑战
背景概述
Fruits 360数据集由Mihai Oltean于2017年创建,旨在为计算机视觉领域提供高质量的水果和蔬菜图像数据。该数据集通过低速电机旋转水果并拍摄视频,使用Logitech C920摄像头记录图像,并通过专用算法提取背景,确保图像质量。数据集包含多种水果和蔬菜的图像,每张图像均标注了详细的元数据,如类型、大小、成熟度等。Fruits 360在图像分类、目标检测等领域具有重要影响力,为相关研究提供了丰富的实验数据。
当前挑战
Fruits 360数据集在构建过程中面临多重挑战。首先,由于光照条件的变化,背景提取算法的设计需要极高的精度,以确保水果与背景的清晰分离。其次,数据集的规模庞大,图像数量尚未完全确定,这为数据管理和存储带来了复杂性。此外,不同种类水果的形态和颜色差异显著,增加了分类模型的训练难度。尽管数据集在图像质量和多样性方面表现出色,但其构建过程仍需克服技术难题,以进一步提升数据的可用性和研究价值。
常用场景
经典使用场景
Fruits 360数据集广泛应用于计算机视觉领域,特别是在图像分类和物体识别任务中。由于其包含了多种水果和蔬菜的高质量图像,研究人员可以利用该数据集训练深度学习模型,以识别和分类不同种类的水果和蔬菜。该数据集还为图像分割和特征提取等任务提供了丰富的素材。
解决学术问题
Fruits 360数据集解决了计算机视觉领域中的多个关键问题,尤其是在小样本学习和多类别分类任务中。通过提供大量标注清晰的图像,该数据集帮助研究人员克服了数据不足的挑战,推动了图像识别算法的进步。此外,数据集中的背景去除算法也为图像预处理技术提供了新的研究方向。
衍生相关工作
Fruits 360数据集衍生了许多经典的研究工作,特别是在深度学习模型的优化和应用方面。例如,基于该数据集的研究提出了多种改进的卷积神经网络(CNN)架构,用于提升图像分类的准确率。此外,该数据集还被用于开发轻量级模型,以在资源受限的设备上实现高效的图像识别。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作