Grocery Store Dataset

github2024-05-13 更新2024-05-31 收录

下载链接：

https://github.com/marcusklasson/GroceryStoreDataset

下载链接

链接失效反馈

官方服务：

更多采购需求

资源简介：

该数据集包含5125张自然图像，涵盖81个不同类别的水果、蔬菜和纸盒商品。这些图像均使用智能手机摄像头在不同的杂货店拍摄。数据集分为42个粗粒度类别和81个细粒度类别，每个细粒度类别都有其标志性图像和产品描述。

This dataset comprises 5,125 natural images, encompassing 81 distinct categories of fruits, vegetables, and carton products. All images were captured using smartphone cameras in various grocery stores. The dataset is divided into 42 coarse-grained categories and 81 fine-grained categories, with each fine-grained category featuring its iconic images and product descriptions.

创建时间：

2018-11-17

原始信息汇总

数据集概述

数据集名称

Grocery Store Dataset

数据集内容

包含5125张自然图像，涵盖81种不同类别的水果、蔬菜和纸盒商品。
图像通过智能手机摄像头在不同杂货店拍摄。

类别划分

81个类别分为42个粗粒度类别，例如Royal Gala和Granny Smith属于同一粗粒度类别Apple。

数据集文件

train.txt, val.txt, test.txt：包含训练、验证和测试集的图像路径及其细粒度和粗粒度标签。
classes.csv：列出所有81个细粒度类别及其对应的粗粒度类别，以及标志性图像和产品描述的路径。

数据集样本

提供了自然图像、标志性图像和产品描述的样本。

数据集更新

2019-11-07：新增了包含292张自然图像的验证集，涉及59个类别。

引用信息

若使用此数据集进行研究，请引用相关论文：

@inproceedings{klasson2019hierarchical, title={A Hierarchical Grocery Store Image Dataset with Visual and Semantic Labels}, author={Klasson, Marcus and Zhang, Cheng and Kjellstr{"o}m, Hedvig}, booktitle={IEEE Winter Conference on Applications of Computer Vision (WACV)}, year={2019} }

搜集汇总

数据集介绍

构建方式

该数据集通过智能手机摄像头在不同杂货店中拍摄的自然图像构建而成，涵盖了5125张图像，涉及81个细粒度类别，包括水果、蔬菜和纸盒包装商品。这些细粒度类别被进一步划分为42个粗粒度类别，例如，'Royal Gala'和'Granny Smith'都属于'Apple'这一粗粒度类别。此外，每个细粒度类别还附带了标志性图像和产品描述，这些数据共同构成了一个层次化的杂货店图像数据集，提供了视觉和语义标签的双重信息。

特点

该数据集的显著特点在于其层次化结构，不仅包含细粒度类别，还提供了粗粒度类别的划分，便于进行多层次的分类任务。此外，数据集中的每张图像都附带了标志性图像和产品描述，这些额外的语义信息为模型提供了更丰富的上下文，有助于提升分类和识别的准确性。数据集的多样性和详细标注使其在计算机视觉和语义分析领域具有广泛的应用潜力。

使用方法

使用该数据集时，用户可以通过**train.txt**、**val.txt**和**test.txt**文件获取训练、验证和测试集的图像路径及其对应的细粒度和粗粒度标签。标签以整数形式表示，便于直接应用于模型训练。此外，**classes.csv**文件提供了所有类别的详细信息，包括标志性图像路径和产品描述，这些信息可以用于进一步的语义分析或模型优化。用户可以根据需求下载数据集并应用于各种计算机视觉模型中。

背景与挑战

背景概述

在计算机视觉领域，对自然场景中物体的识别与分类一直是研究的热点。Grocery Store Dataset 由 Marcus Klasson、Cheng Zhang 和 Hedvig Kjellström 等人创建，旨在提供一个包含自然图像的杂货商品数据集，涵盖水果、蔬菜和包装商品等81个细粒度类别，并进一步划分为42个粗粒度类别。该数据集于2019年首次在IEEE冬季应用计算机视觉会议（WACV）上发布，论文题为《A Hierarchical Grocery Store Image Dataset with Visual and Semantic Labels》。通过提供视觉和语义标签，该数据集为研究人员在多模态学习、图像分类和细粒度识别等领域提供了宝贵的资源，推动了杂货商品识别技术的进步。

当前挑战

Grocery Store Dataset 面临的挑战主要集中在以下几个方面：首先，数据集中的图像来源于不同的杂货店，拍摄环境多样，光照、背景和角度等因素的差异增加了图像分类的复杂性。其次，细粒度分类任务要求模型能够区分相似但不同的商品，如不同品种的苹果，这对模型的细节识别能力提出了较高要求。此外，数据集的构建过程中，如何确保图像质量和标签的准确性也是一个重要挑战。最后，尽管数据集提供了视觉和语义标签，如何有效结合这两种信息以提升模型的分类性能仍是一个开放的研究问题。

常用场景

经典使用场景

在计算机视觉领域，Grocery Store Dataset 常用于图像分类和识别任务。该数据集包含了5125张从不同杂货店拍摄的自然图像，涵盖81个细粒度类别和42个粗粒度类别，如水果、蔬菜和包装商品。通过这些图像，研究者可以训练模型以区分不同类别的商品，尤其是在细粒度分类任务中，如区分不同品种的苹果（如Royal Gala和Granny Smith）。此外，数据集还提供了每个类别的标志性图像和产品描述，进一步丰富了模型的训练数据，使其在视觉和语义层面都能进行有效的学习。

解决学术问题

Grocery Store Dataset 解决了计算机视觉领域中细粒度图像分类的挑战。传统的图像分类任务通常集中在粗粒度类别上，而该数据集通过提供细粒度类别（如不同品种的水果），使得研究者能够探索更复杂的分类问题。此外，数据集中的视觉和语义标签结合，为多模态学习提供了丰富的资源，推动了跨模态信息融合的研究。这一数据集的出现，不仅提升了图像分类的精度，还为相关领域的研究提供了新的思路和方法。

衍生相关工作

基于 Grocery Store Dataset，研究者们开展了多项相关工作。例如，Klasson 等人提出了使用变分多视图学习（Variational Multi-view Learning）进行商品分类的方法，进一步提升了模型的分类性能。此外，该数据集还激发了多模态学习领域的研究，探索如何有效结合视觉和语义信息进行更精准的分类。这些衍生工作不仅丰富了计算机视觉的研究内容，还为实际应用提供了更为先进的解决方案，推动了相关技术的进步。

以上内容由遇见数据集搜集并总结生成

社区讨论

#经验分享

【我遇到的问题】 • 现象：该数据集的下载链接已失效【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72

5,000+

优质数据集

54 个

任务类型

进入经典数据集