five

Fruits-360|图像识别数据集|水果分类数据集

收藏
github2023-09-26 更新2024-05-31 收录
图像识别
水果分类
下载链接:
https://github.com/Chtchou/Fruit-Images-Dataset
下载链接
链接失效反馈
资源简介:
一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。

A high-quality fruit image dataset containing images of various fruits such as apples, bananas, cherries, etc., totaling 42,345 images, divided into training and validation sets, with a total of 64 fruit categories.
创建时间:
2018-06-15
原始信息汇总

数据集概述

数据集名称

Fruits-360

数据集来源

数据集内容

包含多种水果的高质量图像,具体包括:

  • 苹果(不同品种:Golden, Golden-Red, Granny Smith, Red, Red Delicious)
  • 鳄梨
  • 成熟鳄梨
  • 香蕉(黄色,红色)
  • 仙人掌果
  • 哈密瓜(2种)
  • 星果
  • 樱桃(不同品种,Rainier)
  • 柑橘
  • 椰子
  • 百香果
  • 葡萄(粉色,白色,白色2)
  • 葡萄柚(粉色,白色)
  • 番石榴
  • 越橘
  • 猕猴桃
  • 柿子
  • 金桔
  • 柠檬(普通,Meyer)
  • 酸橙
  • 荔枝
  • 芒果
  • 百香果
  • 油桃
  • 橙子
  • 木瓜
  • 西番莲果
  • 桃子
  • 美洲南瓜
  • 梨(不同品种,Abate, Monster, Williams)
  • 菠萝
  • 红龙果
  • 李子
  • 石榴
  • 榅桲
  • 覆盆子
  • 蛇果
  • 草莓
  • 树番茄
  • 蜜柑

数据集属性

  • 总图像数:42345张
  • 训练集大小:31688张图像
  • 验证集大小:10657张图像
  • 类别数:64种水果
  • 图像尺寸:100x100像素
  • 文件名格式:image_index_100.jpg 或 r_image_index_100.jpg 或 r2_image_index_100.jpg

数据集创建方法

  • 使用Logitech C920摄像头拍摄,背景为白色纸张
  • 通过专用算法(洪水填充算法)从非均匀背景中提取水果图像

数据集更新

数据集定期更新新水果种类,GitHub上提供了用于分类的特定版本数据集。

AI搜集汇总
数据集介绍
main_image_url
构建方式
Fruits-360数据集的构建过程采用了高度标准化的图像采集方法。研究人员将水果放置在低速电机的轴上,并使用Logitech C920摄像头录制了20秒的视频。为了确保背景的一致性,水果后方放置了白色纸张作为背景。然而,由于光照条件的变化,背景并不完全均匀,因此开发了一种基于洪水填充算法的专用算法,用于从背景中提取水果图像。该算法通过标记图像边缘的像素,并逐步扩展标记范围,最终将背景像素填充为白色,从而确保水果图像的清晰分离。
使用方法
Fruits-360数据集的使用方法主要基于fastai库,该库作为PyTorch的高级封装,简化了深度学习任务的实现流程。用户可以通过GitHub或Kaggle平台获取数据集,并按照训练集和验证集的文件夹结构加载数据。每个文件夹对应一种水果类别,便于分类任务的实施。数据集的版本管理确保了实验的可重复性,用户可以根据需求选择特定版本进行模型训练和验证。
背景与挑战
背景概述
Fruits-360数据集由Babes-Bolyai大学的Horea Muresan和Mihai Oltean于2017年创建,旨在通过深度学习技术实现水果图像的自动识别。该数据集包含了64种不同水果的图像,总计42,345张,其中训练集包含31,688张图像,验证集包含10,657张图像。每张图像的尺寸为100x100像素,且所有图像均以白色背景呈现。该数据集的构建过程采用了高精度的图像采集技术,并通过专门的算法处理背景,以确保图像质量。Fruits-360的发布为计算机视觉领域的水果识别研究提供了重要的数据支持,推动了相关算法的发展与应用。
当前挑战
Fruits-360数据集在解决水果图像分类问题时面临的主要挑战包括:1) 水果种类繁多且部分品种外观相似,导致分类模型在区分细微差异时容易出错;2) 图像采集过程中光照条件的变化可能导致背景不均匀,尽管采用了专门的背景提取算法,但仍可能影响模型的训练效果。在数据集构建过程中,研究人员还需应对水果旋转和拍摄角度变化带来的复杂性,以确保数据集的多样性和鲁棒性。此外,随着新水果种类的不断加入,数据集的扩展与维护也成为了一个持续的挑战。
常用场景
经典使用场景
Fruits-360数据集在计算机视觉领域中被广泛用于图像分类任务,尤其是水果识别。该数据集包含了64种不同水果的高质量图像,每张图像的分辨率为100x100像素,且背景为白色。研究人员通常使用该数据集来训练和验证深度学习模型,特别是卷积神经网络(CNN),以评估模型在复杂多类别分类任务中的性能。通过该数据集,研究者能够探索不同网络架构、优化算法和数据增强技术对分类精度的影响。
解决学术问题
Fruits-360数据集解决了水果图像分类中的多个学术研究问题。首先,它提供了一个标准化的基准数据集,使得不同研究团队能够在相同的条件下进行模型性能对比。其次,数据集中的图像经过精心处理,背景统一且水果种类多样,这为研究图像特征提取和分类算法提供了理想的环境。此外,数据集还包含了旋转和变形的图像,这有助于研究模型对图像变换的鲁棒性,从而推动计算机视觉领域的发展。
实际应用
Fruits-360数据集在实际应用中具有广泛的价值。例如,在农业自动化领域,该数据集可以用于开发智能水果分拣系统,帮助农民快速、准确地识别和分类不同种类的水果。此外,在零售行业,该数据集可以用于构建智能购物系统,帮助消费者通过图像识别技术快速找到所需的水果。这些应用不仅提高了生产效率,还改善了用户体验,展示了该数据集在现实世界中的巨大潜力。
数据集最近研究
最新研究方向
近年来,Fruits-360数据集在计算机视觉和深度学习领域的研究中占据了重要地位,尤其是在水果识别和分类任务中。随着深度学习技术的快速发展,研究者们利用该数据集探索了多种先进的神经网络架构,如卷积神经网络(CNN)和迁移学习模型,以提高水果识别的准确性和鲁棒性。特别是在农业自动化和智能零售领域,Fruits-360数据集的应用为自动化水果分拣系统和智能购物车等创新解决方案提供了坚实的数据基础。此外,该数据集的持续更新和扩展,使得研究者能够不断验证和改进模型在新水果类别上的泛化能力,推动了水果识别技术的进一步发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国近海地形数据集(渤海,黄海,东海,南海)

本数据集包含历年来通过收集和实测方法取得的中国近海水深点数据、地形图数据(ArcGIS格式),以及黄河口、莱州湾东部、辽东湾、山东南部沿海、南海部分海域的单波束、多波束水深测量数据,包括大尺度的低密度水深数据与局部高密度水深数据。

地球大数据科学工程 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录

GFS

数据来源采自美国国家环境预报中心的GFS(全球预报系统),该系统每天发布4次全球范围的气象数据,分辨率最高可达到0.25° x 0.25°。GFS数据提供FTP下载方式:https://nomads.ncep.noaa.gov/pub/data/nccf/com/gfs/。每次发布的数据保存在命名为gfs.YYYYMMDDHH的文件夹中。本次需要的数据精度为0.25°(0p25),所以数据的文件名为:gfs.t{ HH }z.pgrb2.0p25.f{ XXX }

地球大数据科学工程 收录