Holoselecta

github2024-05-17 更新2024-05-31 收录

下载链接：

https://github.com/tobiagru/HoloselectaDataset

下载链接

链接失效反馈

官方服务：

资源简介：

一个包含标记边界框的真实图像数据集，这些图像来自苏黎世地区自动售货机中的产品。

A dataset comprising real-world images with annotated bounding boxes, capturing products from vending machines in the Zurich area.

创建时间：

2019-06-16

原始信息汇总

数据集概述

1. Holoselecta

类别数: 109
实例数: 10,035
图像数: 295
GTIN标注: 是
描述: 包含在苏黎世地区自动售货机中产品的真实图像，带有标签边界框。
许可证: Creative Commons CC BY 4.0
下载链接: Google Drive

2. Grozi-3.2K

类别数: 3,235
实例数: 未提供
图像数: 3,235 + 680
GTIN标注: 否
描述: 瑞士超市货架上的产品标签数据集，每个产品有一个训练集中的实验室质量图像和验证集中的商店真实环境图像。
下载链接: Google Drive

3. Grozi120

类别数: 120
实例数: 未提供
图像数: 720 + 4,973
GTIN标注: 否
描述: 瑞士超市货架上的产品标签数据集，每个产品有一个训练集中的实验室质量图像和验证集中的商店真实环境图像。
网站: Grozi120

4. The Freiburg Groceries Dataset

类别数: 25
实例数: 5,000
图像数: 5,000
GTIN标注: 否
描述: 包含25种食品类别的5000张256x256 RGB图像。
下载链接: GitHub

5. SKU110K

类别数: 110,712
实例数: 约1.74 * 10^6
图像数: 11,762
GTIN标注: 否
描述: 超市货架上产品的真实图像，带有标签边界框。
Github链接: SKU110K_CVPR19

6. Locount

类别数: 140
实例数: 约1.9 * 10^6
图像数: 50,394
GTIN标注: ?
描述: 在28个不同商店和公寓收集的大型对象定位和计数数据集，包含50,394张图像，超过1.9百万个对象实例。
链接: Locount-dataset

搜集汇总

数据集介绍

构建方式

Holoselecta数据集由苏黎世联邦理工学院的Auto-ID实验室构建，旨在推动杂货产品领域的计算机视觉研究。该数据集包含了苏黎世地区自动售货机中真实产品的图像，并标注了边界框。通过精心挑选和标注，Holoselecta数据集为研究人员提供了一个高质量的基准，用于训练和评估物体检测算法。

特点

Holoselecta数据集的显著特点在于其高精度的标注和现实场景的应用。该数据集包含了109个类别，共计10,035个实例，分布在295张图像中。所有图像均带有GTIN（全球贸易项目编号）标注，确保了数据的准确性和可追溯性。此外，数据集的图像来源于自动售货机，模拟了真实购物环境，使得模型能够在实际应用中表现出色。

使用方法

Holoselecta数据集适用于物体检测任务，特别是在杂货产品识别领域。研究人员可以通过下载数据集并使用标注的边界框进行模型训练和验证。数据集的标注信息可以直接用于目标检测算法的输入，帮助模型学习如何在复杂背景中准确识别和定位产品。此外，数据集的开放许可（CC BY 4.0）允许广泛的研究和应用，促进了该领域的技术进步。

背景与挑战

背景概述

Holoselecta数据集由ETH Zürich的Auto-ID Labs团队在2019年创建，主要研究人员包括Klaus Fuchs和Tobias Grundmann。该数据集专注于杂货产品领域的目标检测，旨在通过计算机视觉技术实现对包装产品的自动识别。Holoselecta数据集包含了109个类别、10,035个实例和295张图像，所有图像均标注了GTIN信息，适用于现实场景中的产品识别任务。该数据集的发布不仅推动了杂货产品检测领域的研究进展，还为相关应用提供了高质量的数据支持。

当前挑战

Holoselecta数据集在构建过程中面临的主要挑战包括：首先，如何在真实场景中获取高质量的图像数据，尤其是在 vending machines 等复杂环境中保持图像清晰度和标注准确性；其次，如何确保数据集的多样性和代表性，以覆盖不同品牌、包装和光照条件下的产品。此外，数据集的标注工作也面临挑战，特别是在处理大量实例时，如何高效且准确地进行边界框标注。这些挑战不仅影响了数据集的构建质量，也对后续的模型训练和性能评估提出了更高的要求。

常用场景

经典使用场景

Holoselecta数据集在杂货产品领域的目标检测任务中展现了其经典应用。该数据集包含了109个类别、10,035个实例和295张图像，所有图像均标注了GTIN信息。这些图像来源于苏黎世地区的自动售货机，具有高度的现实性和复杂性。通过使用Holoselecta数据集，研究者能够训练和验证目标检测算法，特别是在杂货产品识别和定位方面，从而提升计算机视觉技术在零售环境中的应用效果。

解决学术问题

Holoselecta数据集在解决杂货产品识别和定位的学术研究问题中发挥了重要作用。该数据集通过提供高质量的标注数据，帮助研究者克服了在复杂零售环境中进行目标检测的挑战，如产品密集排列、光照变化和背景干扰等。其标注的GTIN信息进一步支持了产品身份验证的研究，推动了计算机视觉技术在零售领域的深入应用，具有重要的学术意义和实际影响。

衍生相关工作

Holoselecta数据集的发布催生了一系列相关的经典工作。研究者基于该数据集开发了多种目标检测算法，如基于深度学习的方法，显著提升了杂货产品识别的准确率和鲁棒性。此外，Holoselecta数据集还被用于验证多模态学习方法在零售环境中的有效性，推动了跨领域技术的融合。这些衍生工作不仅丰富了计算机视觉领域的研究内容，也为零售行业的智能化转型提供了技术支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集