five

Grocery Store Dataset|图像识别数据集|零售商品分类数据集

收藏
github2024-05-13 更新2024-05-31 收录
图像识别
零售商品分类
下载链接:
https://github.com/marcusklasson/GroceryStoreDataset
下载链接
链接失效反馈
资源简介:
该数据集包含5125张自然图像,涵盖81个不同类别的水果、蔬菜和纸盒商品。这些图像均使用智能手机摄像头在不同的杂货店拍摄。数据集分为42个粗粒度类别和81个细粒度类别,每个细粒度类别都有其标志性图像和产品描述。

This dataset comprises 5,125 natural images, encompassing 81 distinct categories of fruits, vegetables, and carton products. All images were captured using smartphone cameras in various grocery stores. The dataset is divided into 42 coarse-grained categories and 81 fine-grained categories, with each fine-grained category featuring its iconic images and product descriptions.
创建时间:
2018-11-17
原始信息汇总

数据集概述

数据集名称

  • Grocery Store Dataset

数据集内容

  • 包含5125张自然图像,涵盖81种不同类别的水果、蔬菜和纸盒商品。
  • 图像通过智能手机摄像头在不同杂货店拍摄。

类别划分

  • 81个类别分为42个粗粒度类别,例如Royal Gala和Granny Smith属于同一粗粒度类别Apple。

数据集文件

  • train.txt, val.txt, test.txt:包含训练、验证和测试集的图像路径及其细粒度和粗粒度标签。
  • classes.csv:列出所有81个细粒度类别及其对应的粗粒度类别,以及标志性图像和产品描述的路径。

数据集样本

  • 提供了自然图像、标志性图像和产品描述的样本。

数据集更新

  • 2019-11-07:新增了包含292张自然图像的验证集,涉及59个类别。

引用信息

  • 若使用此数据集进行研究,请引用相关论文:

    @inproceedings{klasson2019hierarchical, title={A Hierarchical Grocery Store Image Dataset with Visual and Semantic Labels}, author={Klasson, Marcus and Zhang, Cheng and Kjellstr{"o}m, Hedvig}, booktitle={IEEE Winter Conference on Applications of Computer Vision (WACV)}, year={2019} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过智能手机摄像头在不同杂货店中拍摄的自然图像构建而成,涵盖了5125张图像,涉及81个细粒度类别,包括水果、蔬菜和纸盒包装商品。这些细粒度类别被进一步划分为42个粗粒度类别,例如,'Royal Gala'和'Granny Smith'都属于'Apple'这一粗粒度类别。此外,每个细粒度类别还附带了标志性图像和产品描述,这些数据共同构成了一个层次化的杂货店图像数据集,提供了视觉和语义标签的双重信息。
特点
该数据集的显著特点在于其层次化结构,不仅包含细粒度类别,还提供了粗粒度类别的划分,便于进行多层次的分类任务。此外,数据集中的每张图像都附带了标志性图像和产品描述,这些额外的语义信息为模型提供了更丰富的上下文,有助于提升分类和识别的准确性。数据集的多样性和详细标注使其在计算机视觉和语义分析领域具有广泛的应用潜力。
使用方法
使用该数据集时,用户可以通过**train.txt**、**val.txt**和**test.txt**文件获取训练、验证和测试集的图像路径及其对应的细粒度和粗粒度标签。标签以整数形式表示,便于直接应用于模型训练。此外,**classes.csv**文件提供了所有类别的详细信息,包括标志性图像路径和产品描述,这些信息可以用于进一步的语义分析或模型优化。用户可以根据需求下载数据集并应用于各种计算机视觉模型中。
背景与挑战
背景概述
在计算机视觉领域,对自然场景中物体的识别与分类一直是研究的热点。Grocery Store Dataset 由 Marcus Klasson、Cheng Zhang 和 Hedvig Kjellström 等人创建,旨在提供一个包含自然图像的杂货商品数据集,涵盖水果、蔬菜和包装商品等81个细粒度类别,并进一步划分为42个粗粒度类别。该数据集于2019年首次在IEEE冬季应用计算机视觉会议(WACV)上发布,论文题为《A Hierarchical Grocery Store Image Dataset with Visual and Semantic Labels》。通过提供视觉和语义标签,该数据集为研究人员在多模态学习、图像分类和细粒度识别等领域提供了宝贵的资源,推动了杂货商品识别技术的进步。
当前挑战
Grocery Store Dataset 面临的挑战主要集中在以下几个方面:首先,数据集中的图像来源于不同的杂货店,拍摄环境多样,光照、背景和角度等因素的差异增加了图像分类的复杂性。其次,细粒度分类任务要求模型能够区分相似但不同的商品,如不同品种的苹果,这对模型的细节识别能力提出了较高要求。此外,数据集的构建过程中,如何确保图像质量和标签的准确性也是一个重要挑战。最后,尽管数据集提供了视觉和语义标签,如何有效结合这两种信息以提升模型的分类性能仍是一个开放的研究问题。
常用场景
经典使用场景
在计算机视觉领域,Grocery Store Dataset 常用于图像分类和识别任务。该数据集包含了5125张从不同杂货店拍摄的自然图像,涵盖81个细粒度类别和42个粗粒度类别,如水果、蔬菜和包装商品。通过这些图像,研究者可以训练模型以区分不同类别的商品,尤其是在细粒度分类任务中,如区分不同品种的苹果(如Royal Gala和Granny Smith)。此外,数据集还提供了每个类别的标志性图像和产品描述,进一步丰富了模型的训练数据,使其在视觉和语义层面都能进行有效的学习。
解决学术问题
Grocery Store Dataset 解决了计算机视觉领域中细粒度图像分类的挑战。传统的图像分类任务通常集中在粗粒度类别上,而该数据集通过提供细粒度类别(如不同品种的水果),使得研究者能够探索更复杂的分类问题。此外,数据集中的视觉和语义标签结合,为多模态学习提供了丰富的资源,推动了跨模态信息融合的研究。这一数据集的出现,不仅提升了图像分类的精度,还为相关领域的研究提供了新的思路和方法。
衍生相关工作
基于 Grocery Store Dataset,研究者们开展了多项相关工作。例如,Klasson 等人提出了使用变分多视图学习(Variational Multi-view Learning)进行商品分类的方法,进一步提升了模型的分类性能。此外,该数据集还激发了多模态学习领域的研究,探索如何有效结合视觉和语义信息进行更精准的分类。这些衍生工作不仅丰富了计算机视觉的研究内容,还为实际应用提供了更为先进的解决方案,推动了相关技术的进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

UIEB, U45, LSUI

本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。

github 收录

Historical Data Breaches Archive

这个仓库包含了一个全面且不断增长的历史数据泄露集合。所有存储在这里的数据泄露都是公开可用的,可以自由下载用于研究、分析或教育目的。

github 收录

SwimXYZ

SwimXYZ是由法国中央高等电力学院等机构创建的大型合成游泳动作和视频数据集,包含340万帧标注了2D和3D关节的图像,以及240个游泳动作序列。数据集通过使用GANimator生成多样化的游泳动作,并在Unity环境中模拟真实的水下环境。SwimXYZ旨在解决传统运动捕捉系统在游泳等水下运动中应用的局限性,特别是在缺乏标注数据的情况下。该数据集适用于游泳动作分析、2D和3D姿态估计等研究领域,有助于提升运动员训练和比赛表现的技术支持。

arXiv 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录