five

Fruits-360|图像识别数据集|农业技术数据集

收藏
github2019-10-25 更新2024-05-31 收录
图像识别
农业技术
下载链接:
https://github.com/hefan1/Fruit-Images-Dataset
下载链接
链接失效反馈
资源简介:
一个高质量的水果和蔬菜图像数据集,包含120种不同的水果和蔬菜,总计82213张图片。训练集和测试集分别包含61488张和20622张图片,每张图片展示一个水果或蔬菜。此外,还有103张图片展示多个水果。图像大小为100x100像素。

A high-quality dataset of fruit and vegetable images, encompassing 120 different types of fruits and vegetables, totaling 82,213 images. The training set and test set contain 61,488 and 20,622 images respectively, with each image displaying a single fruit or vegetable. Additionally, there are 103 images that showcase multiple fruits. The image size is 100x100 pixels.
创建时间:
2019-10-25
原始信息汇总

数据集概述

数据集名称

Fruits-360: 包含水果和蔬菜图像的数据集

版本

2019.09.21.0

包含内容

数据集包含多种水果和蔬菜的图像,具体包括:

  • 苹果(不同品种:Crimson Snow, Golden, Golden-Red, Granny Smith, Pink Lady, Red, Red Delicious)
  • 鳄梨
  • 成熟鳄梨
  • 香蕉(黄色、红色、Lady Finger)
  • 红甜菜根
  • 蓝莓
  • 仙人掌果实
  • 哈密瓜(2种品种)
  • 杨桃
  • 花椰菜
  • 樱桃(不同品种,Rainier)
  • 樱桃蜡(黄色、红色、黑色)
  • 栗子
  • 克莱门汀
  • 椰子
  • 茄子
  • 姜根
  • 百香果
  • 葡萄(蓝色、粉色、白色(不同品种))
  • 葡萄柚(粉色、白色)
  • 番石榴
  • 榛子
  • 越橘
  • 猕猴桃
  • 柿子
  • 大头菜
  • 金橘
  • 柠檬(普通、Meyer)
  • 酸橙
  • 荔枝
  • 柑橘
  • 芒果(绿色、红色)
  • 山竹
  • 百香果
  • 蟾蜍皮瓜
  • 桑葚
  • 油桃(常规、扁平)
  • 坚果(森林、山核桃)
  • 洋葱(红色、白色)
  • 橙子
  • 木瓜
  • 百香果
  • 桃子(不同品种)
  • 美洲南瓜
  • 梨(不同品种,Abate, Forelle, Kaiser, Monster, Red, Williams)
  • 辣椒(红色、绿色、黄色)
  • 酸浆(普通、带壳)
  • 菠萝(普通、迷你)
  • 红心火龙果
  • 李子(不同品种)
  • 石榴
  • 甜柚
  • 土豆(红色、甜、白色)
  • 榅桲
  • 红毛丹
  • 覆盆子
  • 红加仑
  • 蛇果
  • 草莓(普通、楔形)
  • 番茄(不同品种,Maroon, Cherry Red, Yellow)
  • 核桃

数据集属性

  • 总图像数:82213
  • 训练集大小:61488图像(每张图像一种水果或蔬菜)
  • 测试集大小:20622图像(每张图像一种水果或蔬菜)
  • 多水果集大小:103图像(每张图像多于一种水果或水果类别)
  • 类别数:120(水果和蔬菜)
  • 图像大小:100x100像素
  • 文件名格式:image_index_100.jpg 或 r_image_index_100.jpg 或 r2_image_index_100.jpg 或 r3_image_index_100.jpg(其中“r”表示水果旋转,“r2”表示水果沿第三轴旋转,“100”来自图像大小100x100像素)

数据集结构

  • 训练和测试图像分别存储在TrainingTest文件夹中。
  • 包含多个水果的图像存储在test-multiple_fruits文件夹中。
  • 用于训练神经网络的Python代码存储在src/image_classification文件夹中,使用TensorFlow库。
  • 用于从背景中提取水果或蔬菜的C++代码存储在src/utils文件夹中。
  • 相关研究论文存储在papers文件夹中。

下载方式

数据集可通过Kaggle下载。

许可证

MIT License

版权所有 (c) 2017-2019 Mihai Oltean, Horea Muresan

AI搜集汇总
数据集介绍
main_image_url
构建方式
Fruits-360数据集的构建过程始于将水果和蔬菜种植在低速电机(3 rpm)的轴上,并使用Logitech C920摄像头记录20秒的短片。拍摄过程中,背景采用白色纸张,但由于光照条件的变化,背景并非均匀。为此,开发了一种基于洪水填充算法的专用算法,用于从背景中提取水果。该算法从图像的边缘开始标记像素,逐步标记邻近像素,直到无法再标记更多像素。标记的像素被视为背景并填充为白色,其余像素则被视为属于对象。此过程确保了图像中水果的清晰分离。
使用方法
Fruits-360数据集适用于图像分类和对象检测任务。用户可通过下载包含训练和测试图像的文件夹,使用TensorFlow等深度学习框架进行模型训练。数据集的结构清晰,包含用于训练和测试的图像文件夹,以及用于图像分类的Python代码和用于背景提取的C++代码。此外,数据集还提供了相关研究论文,供用户参考。数据集的下载链接可在GitHub和Kaggle上获取,使用时需遵循MIT许可证。
背景与挑战
背景概述
Fruits-360数据集是由Horea Muresan和Mihai Oltean于2017年至2019年间创建的高质量图像数据集,专注于水果和蔬菜的识别。该数据集包含了120种不同的水果和蔬菜,总计82213张图像,每张图像的分辨率为100x100像素。数据集的创建旨在解决图像分类中的水果识别问题,特别是在深度学习领域。通过使用低速电机和Logitech C920摄像头,研究人员记录了水果在旋转过程中的视频,并从中提取出高质量的图像。这一数据集不仅为学术研究提供了丰富的资源,还为实际应用中的水果识别系统提供了基准测试数据。
当前挑战
尽管Fruits-360数据集在水果和蔬菜的图像分类中表现出色,但其构建过程中仍面临多项挑战。首先,由于拍摄环境的光照条件变化,背景的非均匀性成为一个显著问题,需要开发专门的算法来提取水果图像。其次,数据集中包含多种水果的变种,这增加了分类任务的复杂性。此外,数据集中的多水果图像部分,如test-multiple_fruits文件夹中的图像,展示了真实世界中水果部分遮挡的情况,这对检测算法的鲁棒性提出了更高的要求。这些挑战不仅影响了数据集的构建过程,也对其在实际应用中的性能提出了考验。
常用场景
经典使用场景
Fruits-360数据集在图像分类领域中被广泛应用于水果和蔬菜的识别任务。其高分辨率图像和多样化的类别使得该数据集成为训练和测试深度学习模型的理想选择。通过使用TensorFlow等深度学习框架,研究人员可以构建和优化用于水果和蔬菜分类的神经网络模型。
解决学术问题
Fruits-360数据集解决了图像分类中的多类别识别问题,特别是在水果和蔬菜的复杂多样性背景下。该数据集通过提供大量高质量的图像,帮助研究人员开发和验证能够准确识别不同种类水果和蔬菜的算法,从而推动了计算机视觉和机器学习领域的发展。
实际应用
在实际应用中,Fruits-360数据集可用于开发智能农业系统,通过图像识别技术自动分类和检测农作物,提高农业生产效率。此外,该数据集还可应用于食品行业,用于自动化食品分类和质量控制,确保食品安全和质量的一致性。
数据集最近研究
最新研究方向
在计算机视觉领域,Fruits-360数据集因其丰富的水果和蔬菜图像而备受关注。最新研究方向主要集中在利用深度学习技术提升水果和蔬菜的识别精度。研究者们通过改进卷积神经网络(CNN)架构,结合数据增强和迁移学习策略,以应对不同光照条件、背景复杂度及多目标检测等挑战。此外,该数据集还被用于探索多模态学习,如结合图像与传感器数据,以提高识别的鲁棒性和准确性。这些研究不仅推动了农业自动化的发展,也为食品安全和供应链管理提供了技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2024)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录