five

fruitdataset|水果图像分类数据集|图像特征分析数据集

收藏
github2020-09-29 更新2024-05-31 收录
水果图像分类
图像特征分析
下载链接:
https://github.com/daniloeler/fruitdataset
下载链接
链接失效反馈
资源简介:
fruitdataset包含163张图像,涵盖15种不同类别的水果。数据集提供了原始彩色图像、带有轮廓的二值图像以及包含水果文件名和对应类别的CSV文件。此外,还提供了从水果轮廓计算的傅里叶变换和基于RGB信息的统计描述符等多种特征文件。

The fruitdataset comprises 163 images, encompassing 15 distinct categories of fruits. The dataset provides original color images, binary images with contours, and a CSV file containing fruit filenames along with their corresponding categories. Additionally, it offers various feature files, including Fourier transforms calculated from fruit contours and statistical descriptors based on RGB information.
创建时间:
2020-07-22
原始信息汇总

数据集概述

数据集名称

  • fruitdataset

数据集内容

  • 图像文件

    • fuits.zip: 包含163张水果的原始彩色图像。
    • fruitsContour.zip: 包含水果轮廓的二值图像。
    • filename-class.csv: 包含水果文件名及其对应的水果类别。
  • 特征文件(ARFF格式)

    • Fourier.arff: 从水果轮廓的X和Y坐标计算的傅里叶变换。
    • RGBcomFundo.arff: 包含背景的RGB信息的统计描述符。
    • RGBsemFundo.arff: 不包含背景的RGB信息的统计描述符。
    • RGBcomFundo_Fourier.arff: Fourier.arffRGBcomFundo.arff 特征的组合。
    • RGBsemFundo_Fourier.arff: Fourier.arffRGBsemFundo.arff 特征的组合。
    • PEx-Image-features.arff: PEx-Image图像特征,详细信息见PExImage-Features.pdf

相关研究论文

  1. 作者:Priscila A. Macanhã, Danilo Medeiros Eler, Rogério E. Garcia, Wilson E. Marcilio Junior 年份:2017 标题:Handwritten Feature Descriptor Methods Applied to Fruit Classification 会议:14th International Conference on Information Technology: New Generations 页码:699-705 DOIhttps://doi.org/10.1007/978-3-319-54978-1_87

  2. 作者:Marcela Nishida, Danilo Medeiros Eler, Almir O. Artero, Maurício A. Dias 年份:2015 标题:Comparison of feature spaces in fruit recognition 会议:XI Workshop de Visão Computacional 页码:71–76 链接http://iris.sel.eesc.usp.br/wvc/Anais_2015/Proceedings_WVC2015.pdf

  3. 作者:Priscila A. Macanhã, Wilson E. Marcilio Junior, Danilo Medeiros Eler, Rogério E. Garcia, Ronaldo C. M. Correia 年份:2015 标题:New Approaches of Feature Extraction from Fruits to Augmented Reality Systems 会议:XII Workshop de Realidade Virtual e Aumentada 页码:42-47 链接https://github.com/daniloeler/wrva2015_anais

AI搜集汇总
数据集介绍
main_image_url
构建方式
fruitdataset数据集的构建基于对15种水果的图像采集与处理,共包含163张图像。原始图像以彩色形式存储于fruits.zip文件中,同时提供了水果轮廓的二值图像,存储于fruitsContour.zip文件中。此外,filename-class.csv文件详细记录了每张图像的文件名及其对应的水果类别。为了提取特征,数据集还包含了多种特征文件,如基于水果轮廓的傅里叶变换特征、RGB信息的统计描述符(包括有背景和无背景两种情况),以及这些特征的组合形式。
使用方法
fruitdataset数据集适用于多种机器学习任务,尤其是水果分类和识别。用户可以通过加载fruits.zip和fruitsContour.zip文件获取原始图像和轮廓图像,利用filename-class.csv文件进行标签映射。对于特征提取,用户可以选择加载ARFF格式的特征文件,如Fourier.arff、RGBcomFundo.arff等,或其组合形式,直接用于训练分类模型。此外,数据集还提供了PEx-Image特征文件,进一步扩展了特征选择的可能性。
背景与挑战
背景概述
fruitdataset是由Priscila A. Macanhã、Danilo Medeiros Eler等研究人员于2017年创建的,旨在解决水果分类问题。该数据集包含了163张图像,涵盖15种不同类别的水果,并提供了多种特征描述文件,如傅里叶变换、RGB统计描述符等。这些特征文件不仅包括原始图像的RGB信息,还涉及去除背景后的RGB信息,以及结合傅里叶变换的特征组合。此外,数据集还提供了二值化的水果轮廓图像,进一步丰富了特征提取的可能性。fruitdataset的研究成果已在多个国际会议上发表,如第14届国际信息科技新世代会议(ITNG),展示了其在水果识别领域的应用潜力。
当前挑战
fruitdataset在构建过程中面临多项挑战。首先,如何从有限的图像数据中提取有效的特征,以确保分类的准确性和鲁棒性,是一个关键问题。其次,背景的去除与处理对特征提取的影响较大,如何在保留水果特征的同时去除背景干扰,是构建过程中的一大难点。此外,不同水果的形状、颜色和纹理差异较大,如何在统一的特征空间中进行有效表示,也是一个重要的挑战。最后,数据集的规模相对较小,如何在有限的样本中训练出高效的分类模型,也是研究者需要克服的问题。
常用场景
经典使用场景
fruitdataset数据集在水果分类任务中展现了其经典应用价值。该数据集包含了163张水果图像,涵盖15种不同类别的水果,提供了原始彩色图像、二值化图像以及轮廓信息。这些图像数据不仅支持基于视觉的水果分类研究,还为特征提取和模式识别提供了丰富的素材。通过结合RGB信息和傅里叶变换特征,研究者可以构建高效的分类模型,从而在图像识别领域取得显著进展。
解决学术问题
fruitdataset数据集有效解决了水果分类中的关键学术问题。通过提供多维度的图像数据和预处理特征,如RGB统计描述符和傅里叶变换,该数据集为研究者提供了丰富的特征空间,有助于提升分类算法的准确性和鲁棒性。此外,数据集中的轮廓信息和二值化图像为形状分析和特征提取提供了新的研究方向,推动了计算机视觉和模式识别领域的发展。
实际应用
fruitdataset数据集在实际应用中展现了广泛的应用潜力。在农业领域,该数据集可用于自动化水果分拣系统,通过图像识别技术实现快速、准确的水果分类,提高生产效率。在零售行业,该数据集支持智能货架系统,通过实时识别水果种类,优化库存管理和客户体验。此外,该数据集还可应用于食品安全检测和质量控制,通过图像分析技术确保水果的品质和安全。
数据集最近研究
最新研究方向
在计算机视觉领域,fruitdataset因其丰富的图像特征和多样的水果类别而备受关注。最新的研究方向主要集中在利用深度学习技术进行水果图像的自动分类和特征提取。通过结合傅里叶变换和RGB信息,研究者们探索了更高效的特征组合方法,以提升分类准确性。此外,该数据集还被用于增强现实系统的开发,特别是在水果识别和虚拟展示方面的应用,展示了其在农业科技和智能系统中的潜在价值。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

UAVDT

UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。

arXiv 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

DALY

DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。

ghdx.healthdata.org 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录