five

Fruits-360|图像识别数据集|农业科技数据集

收藏
github2020-01-08 更新2024-05-31 收录
图像识别
农业科技
下载链接:
https://github.com/bharat8/Fruit-Images-Dataset
下载链接
链接失效反馈
资源简介:
一个高质量的水果和蔬菜图像数据集,包含120种不同的水果和蔬菜,总计82213张图片。数据集分为训练集和测试集,每张图片展示一种水果或蔬菜。此外,还有包含多种水果的图片集,用于模拟真实世界中的检测情况。

A high-quality dataset of fruit and vegetable images, encompassing 120 different types of fruits and vegetables, totaling 82,213 images. The dataset is divided into training and test sets, with each image depicting a single fruit or vegetable. Additionally, there are image sets containing multiple fruits, designed to simulate real-world detection scenarios.
创建时间:
2020-01-08
原始信息汇总

数据集概述

数据集名称

Fruits-360: 包含水果和蔬菜图像的数据集

版本

2019.09.21.0

包含内容

数据集包含多种水果和蔬菜的图像,具体包括:

  • 苹果(不同品种:Crimson Snow, Golden, Golden-Red, Granny Smith, Pink Lady, Red, Red Delicious)
  • 鳄梨
  • 成熟鳄梨
  • 香蕉(黄色、红色、Lady Finger)
  • 红甜菜根
  • 蓝莓
  • 仙人掌果
  • 哈密瓜(2种品种)
  • 星果
  • 花椰菜
  • 樱桃(不同品种,Rainier)
  • 樱桃蜡(黄色、红色、黑色)
  • 栗子
  • 克莱门汀
  • 椰子
  • 茄子
  • 根姜
  • 百香果
  • 葡萄(蓝色、粉色、白色(不同品种))
  • 葡萄柚(粉色、白色)
  • 番石榴
  • 榛子
  • 越橘
  • 猕猴桃
  • 柿子
  • 球芽甘蓝
  • 金橘
  • 柠檬(普通、Meyer)
  • 酸橙
  • 荔枝
  • 蜜柑
  • 芒果(绿色、红色)
  • 山竹
  • 百香果
  • 西班牙青蛙皮瓜
  • 桑葚
  • 油桃(常规、扁平)
  • 坚果(森林、山核桃)
  • 洋葱(红色、白色)
  • 橙子
  • 木瓜
  • 百香果
  • 桃子(不同品种)
  • 美洲南瓜
  • 梨(不同品种,Abate, Forelle, Kaiser, Monster, Red, Williams)
  • 辣椒(红色、绿色、黄色)
  • 酸浆(普通、带壳)
  • 菠萝(普通、迷你)
  • 红心火龙果
  • 李子(不同品种)
  • 石榴
  • 甜柚
  • 土豆(红色、甜、白色)
  • 榅桲
  • 红毛丹
  • 覆盆子
  • 红加仑
  • 沙拉
  • 草莓(普通、楔形)
  • 番茄(不同品种,Maroon, Cherry Red, Yellow)
  • 核桃

数据集属性

  • 总图像数:82213
  • 训练集大小:61488图像(每张图像一个水果或蔬菜)
  • 测试集大小:20622图像(每张图像一个水果或蔬菜)
  • 多水果集大小:103图像(每张图像多于一个水果或水果类别)
  • 类别数:120(水果和蔬菜)
  • 图像大小:100x100像素
  • 文件名格式:image_index_100.jpg 或 r_image_index_100.jpg 或 r2_image_index_100.jpg 或 r3_image_index_100.jpg。"r"表示水果旋转,"r2"表示水果沿第三轴旋转。"100"来自图像大小(100x100像素)

数据集结构

  • TrainingTest 文件夹包含用于训练和测试的图像
  • test-multiple_fruits 文件夹包含包含多个水果的图像,部分图像中水果被其他水果部分覆盖,适用于真实世界检测测试

许可证

MIT License

AI搜集汇总
数据集介绍
main_image_url
构建方式
Fruits-360数据集的构建,是通过种植各类水果和蔬菜于低速电机轴上,并录制短时视频,随后采用Logitech C920摄像头捕捉图像。背景使用白纸以简化图像分割,但由于光线条件变化导致背景不均匀,故开发特定算法从背景中提取水果或蔬菜。该算法基于洪水填充类型,逐像素标记直至无更多可标记像素,从而分离出对象。数据集包含训练集、测试集以及多水果测试集,总计82213张图片,涵盖120个水果和蔬菜类别。
特点
该数据集的特点在于其高质量图片、丰富的类别多样性以及针对不同训练需求的多重数据集划分。图像均为100x100像素,分类细致至不同品种的水果,如苹果的不同品种都被视为独立类别。此外,数据集还包括多水果图片,为真实世界的检测提供了优秀的测试案例。
使用方法
使用Fruits-360数据集,用户可从GitHub或Kaggle平台下载。下载后,用户可依据数据集中的目录结构,利用TensorFlow等深度学习框架进行模型训练和测试。数据集的图片命名规则包含索引和旋转标识,方便跟踪处理过程。引用数据集时,应按照提供的方式进行学术引用,尊重版权和贡献者权益。
背景与挑战
背景概述
Fruits-360数据集是一个包含多种水果和蔬菜的高质量图像数据集,创建于2019年9月21日。该数据集由Mihai Oltean和Horea Muresan共同开发,旨在为机器学习和计算机视觉领域提供丰富多样的训练资源。该数据集涵盖了120个类别的水果和蔬菜,包含不同品种的苹果、香蕉、桃子等,总计82213张图像。其核心研究问题是提升果实识别的准确性和鲁棒性。Fruits-360数据集对于推动图像识别技术的发展和应用具有重要意义,被广泛应用于深度学习模型的训练与评估,对相关领域产生了显著的影响。
当前挑战
在构建Fruits-360数据集的过程中,研究人员面临了多项挑战。首先,由于光照条件的变化,图像背景的不均匀性对果实提取算法提出了挑战,研究人员开发了一种基于洪水填充的算法来准确提取果实图像。其次,数据集需要解决的领域问题是果实识别,如何在图像中准确识别并分类多种多样的水果和蔬菜是一项技术挑战。此外,数据集中多果实图像的处理也增加了识别的难度,这对于算法的泛化能力和实际应用场景中的检测性能提出了更高的要求。
常用场景
经典使用场景
Fruits-360数据集是一组包含多种水果和蔬菜的高质量图像集合,广泛应用于计算机视觉领域的水果和蔬菜识别任务中。该数据集提供了不同种类、不同成熟度的水果和蔬菜图像,使得研究者能够基于此数据集训练出能够准确识别各类水果和蔬菜的深度学习模型。
解决学术问题
该数据集解决了传统图像识别中因种类繁多、形态变异大导致识别准确率低的问题。通过提供大规模、多样化的样本,Fruits-360极大地促进了水果和蔬菜识别算法的研究,提高了识别的精确度和鲁棒性,为农产品分类、质量检测等领域提供了可靠的技术支持。
衍生相关工作
基于Fruits-360数据集,研究者们已经衍生出多项相关工作,如深度学习模型在水果识别上的应用研究、图像分割与背景提取技术的改进等。这些研究不仅推动了计算机视觉领域的发展,也为相关行业的实际应用提供了理论和技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

ROBEL

ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。

arXiv 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。

arXiv 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

FAOSTAT Agricultural Data

FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。

www.fao.org 收录