Grocery Dataset

github2024-04-09 更新2024-05-31 收录

下载链接：

https://github.com/gulvarol/grocerydataset

下载链接

链接失效反馈

官方服务：

资源简介：

Grocery Dataset是一个图像数据集，收集自约40个杂货店，使用4种不同的相机，包含10种产品类别。该数据集创建于2014年春季，由土耳其伊斯坦布尔的Idea Teknoloji创建。数据集仅供研究使用，非商业用途。

The Grocery Dataset is an image dataset collected from approximately 40 grocery stores, utilizing four different types of cameras, and encompasses 10 product categories. This dataset was created in the spring of 2014 by Idea Teknoloji in Istanbul, Turkey. It is intended solely for research purposes and not for commercial use.

创建时间：

2017-02-16

原始信息汇总

Grocery Dataset 概述

数据集基本信息

收集来源：约40种杂货商品，使用4种不同相机拍摄。
产品类别：包含10种产品类别。
创建时间与地点：2014年春季，由Idea Teknoloji在伊斯坦布尔创建。
使用限制：仅供研究使用，非商业用途。

数据集下载

下载链接：提供两个部分的数据下载链接，总存储空间约3GB。

数据集组织结构

ShelfImages：包含354张杂货图像，命名规则为"C<c>_P_N<n>S<s>.JPG"，其中<c>表示相机ID，表示货架布局ID，<n>表示图像中顶部货架的排名，<s>表示图像中的货架数量，表示副本号。
ProductImages：包含10个不同产品类别的图像，每个类别有单独的目录，命名规则为"B_N<n>.JPG"，其中表示品牌ID，<n>表示副本号。
BrandImages：包含从ProductImages目录中裁剪的品牌标志图像。
ProductImagesFromShelves：包含从货架图像中裁剪的产品图像，分为10个产品类别和一个负类别，命名规则为"<shelf image name><x><y><w><h>.png"。
BrandImagesFromShelves：包含从ProductImagesFromShelves目录中裁剪的品牌标志图像。

注释文件

annotation.txt：汇总货架图像的注释信息，每行描述一张货架图像，格式为"<shelf image name> <n> <x_1> <y_1> <w_1> <h_1> <b_1> ... <x_n> <y_n> <w_n> <h_n> <b_n>"。
subset.txt：列出用于训练和测试的图像文件名，是BrandImages和BrandImagesFromShelves内容的子集。

引用信息

引用格式：@article{varol16a, TITLE = {{Toward Retail Product Recognition on Grocery Shelves}}, AUTHOR = {Varol, G{"u}l and Kuzu, Ridvan S.}, JOURNAL = {ICIVC}, YEAR = {2014}}

搜集汇总

数据集介绍

构建方式

Grocery Dataset的构建方式体现了对零售场景中产品识别需求的深刻理解。该数据集通过在土耳其伊斯坦布尔的40家杂货店中使用4种不同型号的相机（iPhone5S、iPhone4、Sony Cybershot和Nikon Coolpix）进行图像采集，确保了数据的多样性和代表性。数据集涵盖了10个产品类别，并通过对货架图像和产品图像的精细标注，形成了包含354张货架图像和多个产品类别图像的丰富数据资源。此外，数据集还提供了品牌图像和从货架图像中裁剪出的产品图像，进一步增强了其在零售产品识别研究中的应用价值。

特点

Grocery Dataset的显著特点在于其多层次的图像组织结构和精细的标注体系。数据集不仅包含了原始的货架图像和产品图像，还提供了裁剪后的品牌图像和从货架图像中提取的产品图像，这种多层次的组织方式为不同层次的零售产品识别任务提供了灵活的支持。此外，数据集的标注文件详细记录了每张图像中产品的位置、尺寸和品牌信息，为研究者提供了丰富的标注数据，便于进行精确的模型训练和评估。

使用方法

Grocery Dataset的使用方法灵活多样，适用于多种零售产品识别任务。研究者可以通过下载数据集的图像文件和标注文件，利用ShelfImages、ProductImages、BrandImages等不同目录中的图像进行模型训练和测试。特别是，数据集提供的annotation.txt文件详细记录了每张货架图像中产品的位置和品牌信息，便于进行目标检测和识别任务。此外，subset.txt文件提供了训练和测试集的划分，方便研究者进行模型评估。数据集的开源社区贡献也提供了基于该数据集的模型训练示例，进一步简化了使用流程。

背景与挑战

背景概述

Grocery Dataset是由土耳其伊斯坦布尔的Idea Teknoloji公司于2014年春季创建的一个图像数据集，旨在支持零售产品识别领域的研究。该数据集通过在约40家杂货店使用4种不同型号的相机采集图像，涵盖了10个产品类别。其核心研究问题在于如何从杂货店的货架图像中准确识别和分类产品，这对于零售行业的自动化和库存管理具有重要意义。该数据集的发布为计算机视觉领域的研究人员提供了一个宝贵的资源，特别是在产品识别和货架分析方面，推动了相关技术的进步。

当前挑战

Grocery Dataset在构建过程中面临了多重挑战。首先，图像采集的环境复杂，不同店铺的光照条件、货架布局和产品摆放方式各异，增加了图像处理的难度。其次，数据集中的产品类别有限，仅包含10个类别，这可能限制了其在更广泛应用场景中的适用性。此外，数据集的标注工作也具有挑战性，需要精确标注每个产品的位置、品牌和类别，以确保训练模型的准确性。最后，数据集的规模相对较小，仅约3GB，可能不足以支持深度学习模型的高效训练。

常用场景

经典使用场景

Grocery Dataset的经典使用场景主要集中在零售产品识别与分类任务中。该数据集通过提供从不同角度拍摄的货架图像以及详细的产品标注信息，使得研究者能够训练和评估计算机视觉模型，以实现对零售商品的自动识别与分类。这种应用在零售行业中具有广泛的需求，尤其是在库存管理、货架监控和消费者行为分析等领域。

衍生相关工作

基于Grocery Dataset，许多经典工作得以展开，尤其是在零售产品检测与识别领域。例如，Sayak Paul开发的Grocery-Product-Detection项目展示了如何利用该数据集训练对象检测模型，进一步推动了相关技术的实际应用。此外，该数据集还为多类别分类、图像分割等计算机视觉任务提供了基准，促进了相关算法的改进与优化。

数据集最近研究