five

Fruits-360|图像识别数据集|食品分类数据集

收藏
github2024-05-19 更新2024-05-31 收录
图像识别
食品分类
下载链接:
https://github.com/Horea94/Fruit-Images-Dataset
下载链接
链接失效反馈
资源简介:
一个高质量的水果和蔬菜图像数据集,包含131种不同的水果和蔬菜,总计90483张图片,每张图片展示一种水果或蔬菜。数据集分为训练集和测试集,以及包含多个水果的图片集。图像大小为100x100像素。

A high-quality dataset of fruit and vegetable images, encompassing 131 distinct varieties, totaling 90,483 images, each depicting a single fruit or vegetable. The dataset is partitioned into training and test sets, along with a collection of images featuring multiple fruits. Each image is sized at 100x100 pixels.
创建时间:
2017-05-06
原始信息汇总

数据集概述

数据集名称

Fruits-360: 包含水果和蔬菜的图像数据集

版本

2020.05.18.0

包含内容

数据集包含多种水果和蔬菜的图像,具体包括:

  • 苹果(不同品种)
  • 鳄梨
  • 香蕉(不同颜色)
  • 甜菜根
  • 蓝莓
  • 仙人掌果实
  • 哈密瓜(两种品种)
  • 星果
  • 花椰菜
  • 樱桃(不同品种)
  • 樱桃蜡(不同颜色)
  • 栗子
  • 柑橘
  • 椰子
  • 玉米(带壳)
  • 黄瓜(成熟)
  • 日期
  • 茄子
  • 无花果
  • 姜根
  • 西番莲
  • 葡萄(不同颜色和品种)
  • 葡萄柚(不同颜色)
  • 番石榴
  • 榛子
  • 越橘
  • 猕猴桃
  • 柿子
  • 大头菜
  • 金橘
  • 柠檬(普通和Meyer品种)
  • 酸橙
  • 荔枝
  • 柑橘
  • 芒果(不同颜色)
  • 山竹
  • 百香果
  • 青蛙皮瓜
  • 桑葚
  • 油桃(常规和平)
  • 坚果(森林和山核桃)
  • 洋葱(红和白)
  • 橙子
  • 木瓜
  • 西番莲果
  • 桃子(不同品种)
  • 美洲南瓜
  • 梨(不同品种)
  • 辣椒(不同颜色)
  • 灯笼果(普通和带壳)
  • 菠萝(普通和迷你)
  • 红龙果
  • 李子(不同品种)
  • 石榴
  • 甜柚
  • 土豆(红、甜、白)
  • 榅桲
  • 红毛丹
  • 覆盆子
  • 红加仑
  • 蛇果
  • 草莓(普通和楔形)
  • 树番茄
  • 蜜柑
  • 西红柿(不同品种)
  • 核桃
  • 西瓜

数据集属性

  • 总图像数:90483
  • 训练集大小:67692图像(每张图像一个水果或蔬菜)
  • 测试集大小:22688图像(每张图像一个水果或蔬菜)
  • 多水果集大小:103图像(每张图像包含多个水果或水果类别)
  • 类别数:131(水果和蔬菜)
  • 图像大小:100x100像素
  • 文件名格式:image_index_100.jpg 或 r_image_index_100.jpg 或 r2_image_index_100.jpg 或 r3_image_index_100.jpg("r"表示水果旋转,"r2"表示水果绕第三轴旋转)

存储结构

许可证

MIT License

版权所有 (c) 2017-2020 Mihai Oltean, Horea Muresan

AI搜集汇总
数据集介绍
main_image_url
构建方式
Fruits-360数据集通过在低速电机(3 rpm)的轴上种植水果和蔬菜,并使用Logitech C920摄像头录制20秒的视频来构建。视频中的水果和蔬菜背景为白色纸张,但由于光照条件的变化,背景并非均匀。为此,开发了一种基于洪水填充算法的专用算法,用于从背景中提取水果。该算法从图像的边缘开始,标记所有像素,然后标记邻近已标记像素且颜色距离小于预定值的像素,重复此过程直至无法再标记更多像素。所有标记的像素被视为背景(填充为白色),其余像素则被视为属于对象。
特点
Fruits-360数据集具有以下特点:包含131个类别的水果和蔬菜,总图像数为90483张,其中训练集67692张,测试集22688张,多水果图像集103张。图像尺寸为100x100像素,文件名格式标准化,便于识别和处理。不同品种的同种水果被归类为不同类别,增强了数据集的多样性和复杂性。此外,数据集还包括旋转和多水果图像,模拟真实世界中的检测场景,提升了数据集的应用价值。
使用方法
Fruits-360数据集适用于图像分类和对象检测任务。用户可以通过下载GitHub或Kaggle上的数据集文件,解压后访问训练和测试图像。数据集结构清晰,包含训练集、测试集和多水果测试集,便于直接用于模型训练和评估。提供的Python代码示例使用TensorFlow 2.0和1.8.0库进行神经网络训练,用户可根据需要选择合适的版本进行实验。此外,数据集还附带了C++代码用于背景提取,进一步支持自定义数据处理和模型开发。
背景与挑战
背景概述
Fruits-360数据集是由Horea Muresan和Mihai Oltean于2017年至2020年间创建的高质量图像数据集,专注于水果和蔬菜的图像识别。该数据集包含了131种不同的水果和蔬菜,每种水果和蔬菜都有多个品种,总计90483张图像。这些图像通过低速电机旋转拍摄,确保了不同角度和光照条件下的多样性。Fruits-360数据集的核心研究问题是如何通过深度学习技术准确识别和分类这些水果和蔬菜,这对于农业自动化、食品质量控制等领域具有重要意义。
当前挑战
Fruits-360数据集在构建过程中面临了多个挑战。首先,由于拍摄环境的光照条件变化,背景不均匀,研究人员开发了专门的算法来提取水果和蔬菜的图像。其次,数据集中包含了多种水果和蔬菜的多个品种,这增加了分类任务的复杂性。此外,数据集中的多水果图像(test-multiple_fruits)部分,由于水果之间的遮挡和重叠,进一步增加了识别的难度。这些挑战使得Fruits-360数据集在图像分类和目标检测领域具有重要的研究价值。
常用场景
经典使用场景
在计算机视觉领域,Fruits-360数据集被广泛用于图像分类和对象识别任务。其高分辨率的图像和多样化的水果与蔬菜类别,为研究人员提供了一个理想的平台,用于训练和评估深度学习模型。通过该数据集,研究者可以探索不同品种水果的特征提取和分类算法,从而提升模型在实际应用中的准确性和鲁棒性。
实际应用
在实际应用中,Fruits-360数据集被用于开发智能农业系统和食品质量检测系统。例如,通过训练基于该数据集的深度学习模型,可以实现自动化的水果分类和成熟度检测,从而提高农业生产的效率和质量控制。此外,该数据集还可用于零售行业的自动结账系统,通过图像识别技术快速准确地识别和分类水果与蔬菜。
衍生相关工作
基于Fruits-360数据集,许多研究工作得以展开,包括但不限于图像增强技术、多标签分类算法和实时检测系统。例如,有研究利用该数据集开发了基于卷积神经网络(CNN)的水果识别模型,显著提高了识别精度。此外,还有研究探讨了如何利用迁移学习技术,将该数据集应用于其他类似的图像分类任务,进一步扩展了其应用范围。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

DAT

DAT是一个统一的跨场景跨领域基准,用于开放世界无人机主动跟踪。它提供了24个视觉复杂的场景,以评估算法的跨场景和跨领域泛化能力,并具有高保真度的现实机器人动力学建模。

github 收录