five

Grocery Dataset

收藏
github2024-04-09 更新2024-05-31 收录
下载链接:
https://github.com/gulvarol/grocerydataset
下载链接
链接失效反馈
官方服务:
资源简介:
Grocery Dataset是一个图像数据集,收集自约40个杂货店,使用4种不同的相机,包含10种产品类别。该数据集创建于2014年春季,由土耳其伊斯坦布尔的Idea Teknoloji创建。数据集仅供研究使用,非商业用途。

The Grocery Dataset is an image dataset collected from approximately 40 grocery stores, utilizing four different types of cameras, and encompasses 10 product categories. This dataset was created in the spring of 2014 by Idea Teknoloji in Istanbul, Turkey. It is intended solely for research purposes and not for commercial use.
创建时间:
2017-02-16
原始信息汇总

Grocery Dataset 概述

数据集基本信息

  • 收集来源:约40种杂货商品,使用4种不同相机拍摄。
  • 产品类别:包含10种产品类别。
  • 创建时间与地点:2014年春季,由Idea Teknoloji在伊斯坦布尔创建。
  • 使用限制:仅供研究使用,非商业用途。

数据集下载

  • 下载链接:提供两个部分的数据下载链接,总存储空间约3GB。

数据集组织结构

  • ShelfImages:包含354张杂货图像,命名规则为"C<c>_P<p>_N<n>S<s><i>.JPG",其中<c>表示相机ID,<p>表示货架布局ID,<n>表示图像中顶部货架的排名,<s>表示图像中的货架数量,<i>表示副本号。
  • ProductImages:包含10个不同产品类别的图像,每个类别有单独的目录,命名规则为"B<b>_N<n>.JPG",其中<b>表示品牌ID,<n>表示副本号。
  • BrandImages:包含从ProductImages目录中裁剪的品牌标志图像。
  • ProductImagesFromShelves:包含从货架图像中裁剪的产品图像,分为10个产品类别和一个负类别,命名规则为"<shelf image name><x><y><w><h>.png"。
  • BrandImagesFromShelves:包含从ProductImagesFromShelves目录中裁剪的品牌标志图像。

注释文件

  • annotation.txt:汇总货架图像的注释信息,每行描述一张货架图像,格式为"<shelf image name> <n> <x_1> <y_1> <w_1> <h_1> <b_1> ... <x_n> <y_n> <w_n> <h_n> <b_n>"。
  • subset.txt:列出用于训练和测试的图像文件名,是BrandImages和BrandImagesFromShelves内容的子集。

引用信息

  • 引用格式:@article{varol16a, TITLE = {{Toward Retail Product Recognition on Grocery Shelves}}, AUTHOR = {Varol, G{"u}l and Kuzu, Ridvan S.}, JOURNAL = {ICIVC}, YEAR = {2014}}
搜集汇总
数据集介绍
main_image_url
构建方式
Grocery Dataset的构建方式体现了对零售场景中产品识别需求的深刻理解。该数据集通过在土耳其伊斯坦布尔的40家杂货店中使用4种不同型号的相机(iPhone5S、iPhone4、Sony Cybershot和Nikon Coolpix)进行图像采集,确保了数据的多样性和代表性。数据集涵盖了10个产品类别,并通过对货架图像和产品图像的精细标注,形成了包含354张货架图像和多个产品类别图像的丰富数据资源。此外,数据集还提供了品牌图像和从货架图像中裁剪出的产品图像,进一步增强了其在零售产品识别研究中的应用价值。
特点
Grocery Dataset的显著特点在于其多层次的图像组织结构和精细的标注体系。数据集不仅包含了原始的货架图像和产品图像,还提供了裁剪后的品牌图像和从货架图像中提取的产品图像,这种多层次的组织方式为不同层次的零售产品识别任务提供了灵活的支持。此外,数据集的标注文件详细记录了每张图像中产品的位置、尺寸和品牌信息,为研究者提供了丰富的标注数据,便于进行精确的模型训练和评估。
使用方法
Grocery Dataset的使用方法灵活多样,适用于多种零售产品识别任务。研究者可以通过下载数据集的图像文件和标注文件,利用ShelfImages、ProductImages、BrandImages等不同目录中的图像进行模型训练和测试。特别是,数据集提供的annotation.txt文件详细记录了每张货架图像中产品的位置和品牌信息,便于进行目标检测和识别任务。此外,subset.txt文件提供了训练和测试集的划分,方便研究者进行模型评估。数据集的开源社区贡献也提供了基于该数据集的模型训练示例,进一步简化了使用流程。
背景与挑战
背景概述
Grocery Dataset是由土耳其伊斯坦布尔的Idea Teknoloji公司于2014年春季创建的一个图像数据集,旨在支持零售产品识别领域的研究。该数据集通过在约40家杂货店使用4种不同型号的相机采集图像,涵盖了10个产品类别。其核心研究问题在于如何从杂货店的货架图像中准确识别和分类产品,这对于零售行业的自动化和库存管理具有重要意义。该数据集的发布为计算机视觉领域的研究人员提供了一个宝贵的资源,特别是在产品识别和货架分析方面,推动了相关技术的进步。
当前挑战
Grocery Dataset在构建过程中面临了多重挑战。首先,图像采集的环境复杂,不同店铺的光照条件、货架布局和产品摆放方式各异,增加了图像处理的难度。其次,数据集中的产品类别有限,仅包含10个类别,这可能限制了其在更广泛应用场景中的适用性。此外,数据集的标注工作也具有挑战性,需要精确标注每个产品的位置、品牌和类别,以确保训练模型的准确性。最后,数据集的规模相对较小,仅约3GB,可能不足以支持深度学习模型的高效训练。
常用场景
经典使用场景
Grocery Dataset的经典使用场景主要集中在零售产品识别与分类任务中。该数据集通过提供从不同角度拍摄的货架图像以及详细的产品标注信息,使得研究者能够训练和评估计算机视觉模型,以实现对零售商品的自动识别与分类。这种应用在零售行业中具有广泛的需求,尤其是在库存管理、货架监控和消费者行为分析等领域。
衍生相关工作
基于Grocery Dataset,许多经典工作得以展开,尤其是在零售产品检测与识别领域。例如,Sayak Paul开发的Grocery-Product-Detection项目展示了如何利用该数据集训练对象检测模型,进一步推动了相关技术的实际应用。此外,该数据集还为多类别分类、图像分割等计算机视觉任务提供了基准,促进了相关算法的改进与优化。
数据集最近研究
最新研究方向
在零售产品识别领域,Grocery Dataset因其丰富的图像数据和多样的产品类别,成为研究者们探索自动化货架分析和产品检测的关键资源。该数据集不仅涵盖了从不同角度拍摄的货架图像,还提供了详细的产品和品牌标注,使得其在物体检测、图像分类和品牌识别等前沿研究中具有重要价值。近年来,随着深度学习技术的快速发展,基于该数据集的研究主要集中在提升模型在复杂场景下的识别精度,以及优化模型在实际应用中的实时性和鲁棒性。此外,该数据集还被广泛应用于多模态学习,通过结合图像与文本信息,进一步提升了产品识别的准确性和泛化能力。这些研究不仅推动了零售行业的智能化进程,也为相关领域的技术创新提供了宝贵的实验平台。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作