Computer Vision Datasets, Retail & Grocery Datasets, Classification, Object Detection

github2024-02-24 更新2024-05-31 收录

下载链接：

https://github.com/skrish13/datasets-list

下载链接

链接失效反馈

官方服务：

资源简介：

计算机视觉数据集，零售和杂货数据集，分类数据集，目标检测数据集

Computer vision dataset, retail and grocery dataset, classification dataset, object detection dataset

创建时间：

2017-11-26

原始信息汇总

数据集概述

零售与杂货数据集

RP2K Dataset (2.3k products)
Clobotics-retail50k (shelf polygons tagged)
SKU100K Dataset (CVPR19)
Grocery Products Dataset (8k products) (ECCV14)
CAPG-GP Dataset (102 fine grained products)
Grozi120 Dataset
Tobacco Shelves Dataset (Rack based)
WebMarket
HoloSelecta Vending Machines
Hierarchical Grocery Store Image Dataset (WACV19)
The Freiburg Groceries Dataset (25 Food categories)
SHORT-100 Grocery Dataset (shopping list)
CMU Grocery Dataset (CMU10_3D) (Kitchen Environment Images)
GMU Kitchen Dataset
BigBIRD: (Big) Berkeley Instance Recognition Dataset
Retail Products Checkout
MVTec D2S Checkout

E-commerce数据集

AliBaba-M5
Amazon Product Dataset (2M)
Amazon Berkeley Objects (ABO) - Catalogue, 360 Images and 3D Models
eBay Product Search (1.3M)
Shopee
AliProducts-5M
Cdiscount
JD-10k
Perfect-500k
Stanford Online Products
INSTRE

分类数据集

OpenImages (9 million images, 5000 trainable labels)
ImageNet (1 million images, 1000 labels)
CIFAR10/CIFAR100 (32x32 images; 60,000/10 Classes; 60,000/100 Classes)
TinyImages (Source of CIFAR Datasets creation)

目标检测数据集

PASCAL VOC 2007/2012 (20 Classes)
Microsoft COCO (330k images, >200k labeled, 80 Classes)
ImageNet Object Detection
OpenImages (1.6 Million images, 545 trainable classes)
GTSDB, Tsinghua-Tencent-100K (small object detection)

标志检测数据集

PL2K Dataset
WebLogo-2M Dataset
FlickrLogo-32 (32 logo classes, 70 images per class)
TopLogo-10 (10 logo classes, 70 images per class)
OpenLogo Challenge (352 logo classes, 27,083 images total)

目标分割数据集

PASCAL VOC 2007/2012
Microsoft COCO segmentation
ImageNet Object Localization

部分检测数据集

PASCAL-Parts
VehicleSemanticParts

手部分割/检测数据集

VIVA
Oxford-Hands
EgoHands
EgoYouTubeHands
GTEA
HandOverFace

自动驾驶相关数据集

CityScapes
CityPersons
KITTI Dataset
CamVid
CalTech Pedestrians
Argoverse

特定数据集

Synthetic Vehicle Interior Rear Seat Occupancy Dataset

视觉关系数据集

Visual Genome
OpenImages
Visual-relevant Relationships Dataset
VidVRD

视频目标检测数据集

Youtube-BoundingBoxes

局部特征/补丁匹配数据集

Multi-view Stereo Correspondence Dataset
PS-Dataset
Mikolajczyk et al
GL3D Dataset

情感数据集

Multimodal EmotionLines
Affect in the Wild
One-Minute Gradual-Emotion
EmotiW

音视频数据集

VoxConverse
VGG-Sound
VoxCeleb
VIS (Synthesizing audio for a given clip frames)
MUSIC-SoP

其他数据集

iNaturalist Challenge (Fine-grained classification challenge spanning 5,000 species)
Wildlife detection in videos

搜集汇总

数据集介绍

构建方式

该数据集通过整合多个公开的计算机视觉数据集构建而成，涵盖了零售、杂货、分类、目标检测等多个领域。数据集的构建过程注重全面性与多样性，确保每个子数据集都具备详细的标注信息与多任务支持。通过从不同来源收集数据，并结合最新的研究需求，数据集在规模和挑战性上均达到了较高的标准。

特点

该数据集的特点在于其广泛的应用场景与丰富的任务类型。数据集不仅包含了零售与杂货领域的图像数据，还涵盖了分类、目标检测、分割等多种计算机视觉任务。每个子数据集均经过精心筛选与标注，确保数据的高质量与实用性。此外，数据集中的部分子集还支持多任务学习，为研究者提供了更多的实验可能性。

使用方法

该数据集的使用方法灵活多样，研究者可以根据具体任务需求选择相应的子数据集进行实验。对于零售与杂货领域的任务，可以直接使用RP2K、SKU100K等子数据集；对于分类任务，可以选择OpenImages或ImageNet等经典数据集；对于目标检测任务，PASCAL VOC与Microsoft COCO等子集提供了丰富的标注信息。通过结合不同的子数据集，研究者可以开展跨领域的对比实验，进一步提升模型的泛化能力。

背景与挑战

背景概述

计算机视觉在零售与杂货领域的应用日益广泛，相关数据集的构建成为推动该领域研究的关键。自2014年以来，多个研究机构与学者相继发布了多个数据集，如RP2K、SKU100K、Grocery Products Dataset等，涵盖了商品分类、目标检测等核心任务。这些数据集不仅为学术界提供了丰富的研究资源，也为工业界的实际应用提供了数据支持。例如，SKU100K数据集在CVPR2019上发布，专注于零售货架上的商品检测，极大地推动了零售自动化技术的发展。这些数据集的构建与发布，标志着计算机视觉技术在零售与杂货领域的深入应用，并为相关研究提供了坚实的基础。

当前挑战

在零售与杂货领域的计算机视觉研究中，数据集的构建与应用面临多重挑战。首先，商品种类繁多且外观相似，导致分类与检测任务难度增加。其次，零售环境复杂多变，光照、遮挡等因素对图像质量产生显著影响，增加了数据标注与模型训练的难度。此外，数据集的规模与多样性也是关键问题，大规模数据集的构建需要耗费大量人力物力，而数据的不平衡性则可能导致模型性能的偏差。最后，数据隐私与安全问题在零售场景中尤为突出，如何在保护用户隐私的前提下获取高质量数据，成为数据集构建中的一大挑战。

常用场景

经典使用场景

在计算机视觉领域，零售与杂货数据集广泛应用于商品分类、货架检测和自动结账系统。这些数据集通过提供大量标注图像，帮助研究人员和开发者训练和优化深度学习模型，以实现高精度的商品识别和货架管理。例如，RP2K数据集和SKU100K数据集在商品分类和检测任务中表现出色，成为该领域的经典基准。

解决学术问题

零售与杂货数据集有效解决了商品识别中的细粒度分类问题，尤其是在面对外观相似但类别不同的商品时。通过提供丰富的标注数据，这些数据集帮助研究人员开发出更精确的分类算法，提升了模型在复杂场景下的泛化能力。此外，这些数据集还推动了目标检测和分割技术的发展，为自动结账系统和智能货架管理提供了技术支持。

衍生相关工作

零售与杂货数据集催生了许多经典的研究工作。例如，基于SKU100K数据集的研究提出了高效的货架商品检测算法，显著提升了检测精度和速度。此外，RP2K数据集的研究推动了细粒度商品分类技术的发展，为后续的零售智能化研究提供了重要参考。这些工作不仅推动了计算机视觉技术的进步，也为零售行业的数字化转型提供了有力支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集