Nattakarn/fruit-and-vegetable-image-recognition
收藏Hugging Face2024-05-31 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nattakarn/fruit-and-vegetable-image-recognition
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含图像和标签两个特征。图像特征的数据类型为图像,标签特征的数据类型为类别标签,具体包括36种不同的类别,如苹果、香蕉、甜菜根等。数据集分为训练集和测试集,训练集包含2492个样本,测试集包含623个样本。数据集的下载大小为1659832910字节,数据集的总大小为1614106111.5159998字节。
该数据集包含图像和标签两个特征。图像特征的数据类型为图像,标签特征的数据类型为类别标签,具体包括36种不同的类别,如苹果、香蕉、甜菜根等。数据集分为训练集和测试集,训练集包含2492个样本,测试集包含623个样本。数据集的下载大小为1659832910字节,数据集的总大小为1614106111.5159998字节。
提供机构:
Nattakarn
原始信息汇总
数据集概述
数据集特征
- image:图像数据类型。
- label:分类标签数据类型,包含以下类别:
- 0: apple
- 1: banana
- 2: beetroot
- 3: bell pepper
- 4: cabbage
- 5: capsicum
- 6: carrot
- 7: cauliflower
- 8: chilli pepper
- 9: corn
- 10: cucumber
- 11: eggplant
- 12: garlic
- 13: ginger
- 14: grapes
- 15: jalepeno
- 16: kiwi
- 17: lemon
- 18: lettuce
- 19: mango
- 20: onion
- 21: orange
- 22: paprika
- 23: pear
- 24: peas
- 25: pineapple
- 26: pomegranate
- 27: potato
- 28: raddish
- 29: soy beans
- 30: spinach
- 31: sweetcorn
- 32: sweetpotato
- 33: tomato
- 34: turnip
- 35: watermelon
数据集分割
- train:训练集,包含2492个样本,总大小为1317182373.7159998字节。
- test:测试集,包含623个样本,总大小为296923737.8字节。
数据集大小
- 下载大小:1659832910字节
- 数据集总大小:1614106111.5159998字节
数据文件配置
- config_name: default
- split: train, path: data/train-*
- split: test, path: data/test-*
搜集汇总
数据集介绍

构建方式
Nattakarn/fruit-and-vegetable-image-recognition数据集的构建,是通过收集多种水果和蔬菜的图像,并将每张图像与其对应的类别标签相匹配而实现的。数据集包含训练集和测试集,其中训练集包含2492个样本,测试集包含623个样本,确保了模型的训练与验证的分离,为模型提供了评估其泛化能力的机会。
特点
该数据集的特点在于其多样性,涵盖了从苹果到西瓜等35种不同的水果和蔬菜类别。每个类别都有相应的图像数据,这些图像被标记为唯一的类标签,从而方便了图像识别模型的训练和测试。此外,数据集的大小适中,便于处理和存储,同时提供了足够的样本量以保证模型训练的鲁棒性。
使用方法
使用该数据集时,用户可以直接下载并解压数据集文件,然后根据配置文件中的路径加载训练和测试数据。数据集采用了HuggingFace的Datasets库的格式,可以方便地与该库的API进行集成,从而简化了数据加载和预处理的过程。用户可以根据自己的需要,利用数据集中的图像和标签进行模型训练、验证和测试等任务。
背景与挑战
背景概述
在计算机视觉领域,图像识别技术的研究与应用日益广泛。Nattakarn/fruit-and-vegetable-image-recognition数据集,创建于近期,由Nattakarn团队精心构建,旨在推动水果与蔬菜图像识别技术的发展。该数据集包含多种水果与蔬菜的图像,共分为36类,涵盖了从苹果到西瓜等常见品种。该数据集自发布以来,受到了广泛关注,并为相关领域的研究提供了宝贵的资源。
当前挑战
该数据集在解决水果与蔬菜图像识别问题的同时,面临着多重挑战。首先,如何确保图像数据的质量和多样性,以适应不同的识别场景,是一大难题。其次,数据集构建过程中,对标签的准确性进行了严格的控制,避免了分类错误,这对于训练高效、准确的识别模型至关重要。此外,在数据集的应用过程中,如何处理光照、角度、遮挡等因素对识别准确率的影响,亦是当前研究的重要课题。
常用场景
经典使用场景
在深度学习与计算机视觉研究领域,Nattakarn/fruit-and-vegetable-image-recognition数据集被广泛用于图像识别与分类任务。其包含的多种水果与蔬菜图像,为模型训练提供了丰富的视觉特征学习素材,成为进行细粒度识别研究的重要资源。
衍生相关工作
基于该数据集,研究者们进一步开展了多种相关工作,如提出新的识别算法、构建更加复杂的分类模型,以及探索图像识别技术在其他领域的应用,推动了计算机视觉技术的不断进步与拓展。
数据集最近研究
最新研究方向
在计算机视觉领域,图像识别技术正日益精进,尤其是细粒度图像识别成为研究的热点。Nattakarn/fruit-and-vegetable-image-recognition数据集为此领域提供了丰富的样本资源,包含多种水果和蔬菜的图像,为细粒度识别研究提供了有力支撑。近期研究集中于深度学习模型的优化,以提高识别准确度,尤其是对相似度较高的类别,如不同种类的辣椒。此外,研究亦关注于数据增强技术的应用,以及跨域识别的挑战,以期提升模型在实际应用中的泛化能力。此数据集的广泛应用,为智能农业、无人零售等领域的发展贡献了重要价值。
以上内容由遇见数据集搜集并总结生成



