five

Holoselecta

收藏
github2024-05-17 更新2024-05-31 收录
下载链接:
https://github.com/tobiagru/HoloselectaDataset
下载链接
链接失效反馈
官方服务:
资源简介:
一个包含标记边界框的真实图像数据集,这些图像来自苏黎世地区自动售货机中的产品。

A dataset comprising real-world images with annotated bounding boxes, capturing products from vending machines in the Zurich area.
创建时间:
2019-06-16
原始信息汇总

数据集概述

1. Holoselecta

  • 类别数: 109
  • 实例数: 10,035
  • 图像数: 295
  • GTIN标注: 是
  • 描述: 包含在苏黎世地区自动售货机中产品的真实图像,带有标签边界框。
  • 许可证: Creative Commons CC BY 4.0
  • 下载链接: Google Drive

2. Grozi-3.2K

  • 类别数: 3,235
  • 实例数: 未提供
  • 图像数: 3,235 + 680
  • GTIN标注: 否
  • 描述: 瑞士超市货架上的产品标签数据集,每个产品有一个训练集中的实验室质量图像和验证集中的商店真实环境图像。
  • 下载链接: Google Drive

3. Grozi120

  • 类别数: 120
  • 实例数: 未提供
  • 图像数: 720 + 4,973
  • GTIN标注: 否
  • 描述: 瑞士超市货架上的产品标签数据集,每个产品有一个训练集中的实验室质量图像和验证集中的商店真实环境图像。
  • 网站: Grozi120

4. The Freiburg Groceries Dataset

  • 类别数: 25
  • 实例数: 5,000
  • 图像数: 5,000
  • GTIN标注: 否
  • 描述: 包含25种食品类别的5000张256x256 RGB图像。
  • 下载链接: GitHub

5. SKU110K

  • 类别数: 110,712
  • 实例数: 约1.74 * 10^6
  • 图像数: 11,762
  • GTIN标注: 否
  • 描述: 超市货架上产品的真实图像,带有标签边界框。
  • Github链接: SKU110K_CVPR19

6. Locount

  • 类别数: 140
  • 实例数: 约1.9 * 10^6
  • 图像数: 50,394
  • GTIN标注: ?
  • 描述: 在28个不同商店和公寓收集的大型对象定位和计数数据集,包含50,394张图像,超过1.9百万个对象实例。
  • 链接: Locount-dataset
搜集汇总
数据集介绍
main_image_url
构建方式
Holoselecta数据集由苏黎世联邦理工学院的Auto-ID实验室构建,旨在推动杂货产品领域的计算机视觉研究。该数据集包含了苏黎世地区自动售货机中真实产品的图像,并标注了边界框。通过精心挑选和标注,Holoselecta数据集为研究人员提供了一个高质量的基准,用于训练和评估物体检测算法。
特点
Holoselecta数据集的显著特点在于其高精度的标注和现实场景的应用。该数据集包含了109个类别,共计10,035个实例,分布在295张图像中。所有图像均带有GTIN(全球贸易项目编号)标注,确保了数据的准确性和可追溯性。此外,数据集的图像来源于自动售货机,模拟了真实购物环境,使得模型能够在实际应用中表现出色。
使用方法
Holoselecta数据集适用于物体检测任务,特别是在杂货产品识别领域。研究人员可以通过下载数据集并使用标注的边界框进行模型训练和验证。数据集的标注信息可以直接用于目标检测算法的输入,帮助模型学习如何在复杂背景中准确识别和定位产品。此外,数据集的开放许可(CC BY 4.0)允许广泛的研究和应用,促进了该领域的技术进步。
背景与挑战
背景概述
Holoselecta数据集由ETH Zürich的Auto-ID Labs团队在2019年创建,主要研究人员包括Klaus Fuchs和Tobias Grundmann。该数据集专注于杂货产品领域的目标检测,旨在通过计算机视觉技术实现对包装产品的自动识别。Holoselecta数据集包含了109个类别、10,035个实例和295张图像,所有图像均标注了GTIN信息,适用于现实场景中的产品识别任务。该数据集的发布不仅推动了杂货产品检测领域的研究进展,还为相关应用提供了高质量的数据支持。
当前挑战
Holoselecta数据集在构建过程中面临的主要挑战包括:首先,如何在真实场景中获取高质量的图像数据,尤其是在 vending machines 等复杂环境中保持图像清晰度和标注准确性;其次,如何确保数据集的多样性和代表性,以覆盖不同品牌、包装和光照条件下的产品。此外,数据集的标注工作也面临挑战,特别是在处理大量实例时,如何高效且准确地进行边界框标注。这些挑战不仅影响了数据集的构建质量,也对后续的模型训练和性能评估提出了更高的要求。
常用场景
经典使用场景
Holoselecta数据集在杂货产品领域的目标检测任务中展现了其经典应用。该数据集包含了109个类别、10,035个实例和295张图像,所有图像均标注了GTIN信息。这些图像来源于苏黎世地区的自动售货机,具有高度的现实性和复杂性。通过使用Holoselecta数据集,研究者能够训练和验证目标检测算法,特别是在杂货产品识别和定位方面,从而提升计算机视觉技术在零售环境中的应用效果。
解决学术问题
Holoselecta数据集在解决杂货产品识别和定位的学术研究问题中发挥了重要作用。该数据集通过提供高质量的标注数据,帮助研究者克服了在复杂零售环境中进行目标检测的挑战,如产品密集排列、光照变化和背景干扰等。其标注的GTIN信息进一步支持了产品身份验证的研究,推动了计算机视觉技术在零售领域的深入应用,具有重要的学术意义和实际影响。
衍生相关工作
Holoselecta数据集的发布催生了一系列相关的经典工作。研究者基于该数据集开发了多种目标检测算法,如基于深度学习的方法,显著提升了杂货产品识别的准确率和鲁棒性。此外,Holoselecta数据集还被用于验证多模态学习方法在零售环境中的有效性,推动了跨领域技术的融合。这些衍生工作不仅丰富了计算机视觉领域的研究内容,也为零售行业的智能化转型提供了技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作