five

Computer Vision Datasets, Retail & Grocery Datasets, Classification, Object Detection

收藏
github2024-02-24 更新2024-05-31 收录
下载链接:
https://github.com/skrish13/datasets-list
下载链接
链接失效反馈
官方服务:
资源简介:
计算机视觉数据集,零售和杂货数据集,分类数据集,目标检测数据集

Computer vision dataset, retail and grocery dataset, classification dataset, object detection dataset
创建时间:
2017-11-26
原始信息汇总

数据集概述

零售与杂货数据集

  • RP2K Dataset (2.3k products)
  • Clobotics-retail50k (shelf polygons tagged)
  • SKU100K Dataset (CVPR19)
  • Grocery Products Dataset (8k products) (ECCV14)
  • CAPG-GP Dataset (102 fine grained products)
  • Grozi120 Dataset
  • Tobacco Shelves Dataset (Rack based)
  • WebMarket
  • HoloSelecta Vending Machines
  • Hierarchical Grocery Store Image Dataset (WACV19)
  • The Freiburg Groceries Dataset (25 Food categories)
  • SHORT-100 Grocery Dataset (shopping list)
  • CMU Grocery Dataset (CMU10_3D) (Kitchen Environment Images)
  • GMU Kitchen Dataset
  • BigBIRD: (Big) Berkeley Instance Recognition Dataset
  • Retail Products Checkout
  • MVTec D2S Checkout

E-commerce数据集

  • AliBaba-M5
  • Amazon Product Dataset (2M)
  • Amazon Berkeley Objects (ABO) - Catalogue, 360 Images and 3D Models
  • eBay Product Search (1.3M)
  • Shopee
  • AliProducts-5M
  • Cdiscount
  • JD-10k
  • Perfect-500k
  • Stanford Online Products
  • INSTRE

分类数据集

  • OpenImages (9 million images, 5000 trainable labels)
  • ImageNet (1 million images, 1000 labels)
  • CIFAR10/CIFAR100 (32x32 images; 60,000/10 Classes; 60,000/100 Classes)
  • TinyImages (Source of CIFAR Datasets creation)

目标检测数据集

  • PASCAL VOC 2007/2012 (20 Classes)
  • Microsoft COCO (330k images, >200k labeled, 80 Classes)
  • ImageNet Object Detection
  • OpenImages (1.6 Million images, 545 trainable classes)
  • GTSDB, Tsinghua-Tencent-100K (small object detection)

标志检测数据集

  • PL2K Dataset
  • WebLogo-2M Dataset
  • FlickrLogo-32 (32 logo classes, 70 images per class)
  • TopLogo-10 (10 logo classes, 70 images per class)
  • OpenLogo Challenge (352 logo classes, 27,083 images total)

目标分割数据集

  • PASCAL VOC 2007/2012
  • Microsoft COCO segmentation
  • ImageNet Object Localization

部分检测数据集

  • PASCAL-Parts
  • VehicleSemanticParts

手部分割/检测数据集

  • VIVA
  • Oxford-Hands
  • EgoHands
  • EgoYouTubeHands
  • GTEA
  • HandOverFace

自动驾驶相关数据集

  • CityScapes
  • CityPersons
  • KITTI Dataset
  • CamVid
  • CalTech Pedestrians
  • Argoverse

特定数据集

  • Synthetic Vehicle Interior Rear Seat Occupancy Dataset

视觉关系数据集

  • Visual Genome
  • OpenImages
  • Visual-relevant Relationships Dataset
  • VidVRD

视频目标检测数据集

  • Youtube-BoundingBoxes

局部特征/补丁匹配数据集

  • Multi-view Stereo Correspondence Dataset
  • PS-Dataset
  • Mikolajczyk et al
  • GL3D Dataset

情感数据集

  • Multimodal EmotionLines
  • Affect in the Wild
  • One-Minute Gradual-Emotion
  • EmotiW

音视频数据集

  • VoxConverse
  • VGG-Sound
  • VoxCeleb
  • VIS (Synthesizing audio for a given clip frames)
  • MUSIC-SoP

其他数据集

  • iNaturalist Challenge (Fine-grained classification challenge spanning 5,000 species)
  • Wildlife detection in videos
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过整合多个公开的计算机视觉数据集构建而成,涵盖了零售、杂货、分类、目标检测等多个领域。数据集的构建过程注重全面性与多样性,确保每个子数据集都具备详细的标注信息与多任务支持。通过从不同来源收集数据,并结合最新的研究需求,数据集在规模和挑战性上均达到了较高的标准。
特点
该数据集的特点在于其广泛的应用场景与丰富的任务类型。数据集不仅包含了零售与杂货领域的图像数据,还涵盖了分类、目标检测、分割等多种计算机视觉任务。每个子数据集均经过精心筛选与标注,确保数据的高质量与实用性。此外,数据集中的部分子集还支持多任务学习,为研究者提供了更多的实验可能性。
使用方法
该数据集的使用方法灵活多样,研究者可以根据具体任务需求选择相应的子数据集进行实验。对于零售与杂货领域的任务,可以直接使用RP2K、SKU100K等子数据集;对于分类任务,可以选择OpenImages或ImageNet等经典数据集;对于目标检测任务,PASCAL VOC与Microsoft COCO等子集提供了丰富的标注信息。通过结合不同的子数据集,研究者可以开展跨领域的对比实验,进一步提升模型的泛化能力。
背景与挑战
背景概述
计算机视觉在零售与杂货领域的应用日益广泛,相关数据集的构建成为推动该领域研究的关键。自2014年以来,多个研究机构与学者相继发布了多个数据集,如RP2K、SKU100K、Grocery Products Dataset等,涵盖了商品分类、目标检测等核心任务。这些数据集不仅为学术界提供了丰富的研究资源,也为工业界的实际应用提供了数据支持。例如,SKU100K数据集在CVPR2019上发布,专注于零售货架上的商品检测,极大地推动了零售自动化技术的发展。这些数据集的构建与发布,标志着计算机视觉技术在零售与杂货领域的深入应用,并为相关研究提供了坚实的基础。
当前挑战
在零售与杂货领域的计算机视觉研究中,数据集的构建与应用面临多重挑战。首先,商品种类繁多且外观相似,导致分类与检测任务难度增加。其次,零售环境复杂多变,光照、遮挡等因素对图像质量产生显著影响,增加了数据标注与模型训练的难度。此外,数据集的规模与多样性也是关键问题,大规模数据集的构建需要耗费大量人力物力,而数据的不平衡性则可能导致模型性能的偏差。最后,数据隐私与安全问题在零售场景中尤为突出,如何在保护用户隐私的前提下获取高质量数据,成为数据集构建中的一大挑战。
常用场景
经典使用场景
在计算机视觉领域,零售与杂货数据集广泛应用于商品分类、货架检测和自动结账系统。这些数据集通过提供大量标注图像,帮助研究人员和开发者训练和优化深度学习模型,以实现高精度的商品识别和货架管理。例如,RP2K数据集和SKU100K数据集在商品分类和检测任务中表现出色,成为该领域的经典基准。
解决学术问题
零售与杂货数据集有效解决了商品识别中的细粒度分类问题,尤其是在面对外观相似但类别不同的商品时。通过提供丰富的标注数据,这些数据集帮助研究人员开发出更精确的分类算法,提升了模型在复杂场景下的泛化能力。此外,这些数据集还推动了目标检测和分割技术的发展,为自动结账系统和智能货架管理提供了技术支持。
衍生相关工作
零售与杂货数据集催生了许多经典的研究工作。例如,基于SKU100K数据集的研究提出了高效的货架商品检测算法,显著提升了检测精度和速度。此外,RP2K数据集的研究推动了细粒度商品分类技术的发展,为后续的零售智能化研究提供了重要参考。这些工作不仅推动了计算机视觉技术的进步,也为零售行业的数字化转型提供了有力支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作