norwegian-grocery

Hugging Face2026-04-06 更新2026-04-07 收录

下载链接：

https://huggingface.co/datasets/valiantlynxz/norwegian-grocery

下载链接

链接失效反馈

官方服务：

资源简介：

NorgesGruppen Grocery Detection Dataset 是一个用于挪威杂货店货架图像的目标检测数据集，源自NorgesGruppen Data竞赛。数据集包含248张货架图像，22,731个COCO格式的边界框标注，涵盖356个产品类别（包括未知产品类别）。此外，数据集还提供了327种产品的多角度参考照片，共计1,582张图像。数据集支持COCO和YOLO两种格式，其中YOLO格式在加载时自动转换。数据集分为训练集和验证集，比例为85:15。适用于目标检测和图像分类任务，特别是零售和货架检测场景。数据集还包含产品元数据，如条形码、产品名称和图像类型。

创建时间：

2026-03-26

原始信息汇总

数据集概述

基本信息

数据集名称: NorgesGruppen Grocery Detection Dataset
托管地址: https://huggingface.co/datasets/valiantlynxz/norwegian-grocery
许可证: cc-by-nc-4.0
任务类别: 目标检测、图像分类
语言: 挪威语 (no)
标签: grocery, retail, shelf-detection, coco, yolo, norgesgruppen
规模类别: n<1K

数据集内容

货架图像: 248张来自挪威杂货店的货架图像（Egg, Frokost, Knekkebrod, Varmedrikker类别）。
边界框标注: 22,731个COCO格式的边界框标注。
产品类别: 356个产品类别（ID 0-355，其中355为unknown_product）。
产品参考图像: 327个产品的多角度参考照片，总计1,582张图像。
训练/验证集划分: 211张训练图像，37张验证图像（85/15比例，随机种子为42）。

数据配置

数据集提供三种配置，可通过Hugging Face datasets库加载。

配置名称	默认	描述	数据划分
`coco`	是	原始的COCO格式标注，包含完整元数据	train, validation
`yolo`	否	自动转换为YOLO归一化格式`[cx, cy, w, h]`	train, validation
`products`	否	产品参考图像及其元数据	train

COCO 配置

每个样本包含货架图像及其COCO格式标注。

image: PIL Image对象。
image_id: 整数。
width: 图像宽度（像素）。
height: 图像高度（像素）。
annotations: COCO标注列表的JSON字符串。每个标注包含id、category_id、bbox（格式为[x, y, w, h]，单位为像素）、area、product_code等字段。

YOLO 配置

使用相同的图像，但边界框自动转换为YOLO归一化中心格式。

image: PIL Image对象。
image_id: 整数。
labels: 整数列表，表示类别ID。
bboxes: 列表的列表，格式为[[cx, cy, w, h], ...]，坐标已归一化到[0, 1]范围。

Products 配置

按产品代码组织的327个产品的参考图像。

image: PIL Image对象（一个角度）。
product_code: 条形码字符串。
product_name: 产品名称字符串。
image_type: 图像角度类型，如"main"、"front"、"back"、"left"、"right"、"top"、"bottom"。
annotation_count: 该产品在货架图像中出现的次数。

数据结构

norwegian_grocery.py # 自定义加载脚本（由HF自动发现） train/ annotations.json # COCO格式的标注文件 images/ # 248张货架图像（.jpg/.jpeg格式） NM_NGD_product_images/ metadata.json # 产品名称、条形码、标注次数的元数据 {barcode}/ # 按条形码组织的产品参考图像 scripts/ coco_to_yolo.py # 将COCO格式转换为YOLO格式的脚本（包含训练/验证集划分）

关键统计

图像尺寸范围: 宽度481-5712像素，高度399-4624像素。
平均标注数: 每张图像约92个标注。
最常见类别: unknown_product（ID 355），共422个标注。
产品参考图像总数: 1,582张，涵盖327个产品。

使用说明

可通过提供的Python脚本scripts/coco_to_yolo.py在本地生成适用于YOLO训练的文件结构。
数据集与https://github.com/kuben-labs/nmai中的检测项目兼容。

搜集汇总

数据集介绍

构建方式

在零售计算机视觉领域，挪威杂货检测数据集源自NorgesGruppen数据竞赛，系统性地采集了挪威杂货店货架图像。该数据集包含248张货架图像，涵盖鸡蛋、早餐、脆面包和热饮等商品类别，并采用COCO格式标注了22,731个边界框，涉及356种产品类别。构建过程中，通过人工或半自动方式对图像中的商品进行精细标注，确保每个边界框均关联产品条形码与名称，同时为327种商品提供了多角度参考图像，共计1,582张，以支持更全面的模型训练与验证。

特点

该数据集显著特点在于其专注于挪威零售环境，提供了丰富的多格式标注支持。除了标准的COCO格式外，数据集通过动态转换机制，可直接加载为YOLO归一化中心坐标格式，无需额外预处理。数据集包含大量未知产品类别标注，增强了现实场景下的鲁棒性训练潜力。此外，配套的多角度商品参考图像库，为细粒度识别与跨视角分析提供了独特资源，图像分辨率多样，标注密度较高，平均每张图像包含约92个标注，反映了真实货架的复杂商品布局。

使用方法

利用Hugging Face的datasets库，用户可便捷加载不同配置的数据集。默认加载COCO格式，包含原始图像、标注及元数据；通过指定name参数为'yolo'，可自动获取转换为YOLO格式的数据，边界框已归一化；而'products'配置则提供商品参考图像及其元数据。对于本地YOLO训练，可使用附带的Python脚本将COCO标注转换为标准YOLO目录结构。数据集已预设训练与验证分割，可直接用于目标检测或图像分类模型的开发与评估。

背景与挑战

背景概述

在零售智能化与计算机视觉交叉领域，挪威杂货检测数据集（Norwegian Grocery）由NorgesGruppen于数据竞赛中创建，旨在推动货架商品自动识别技术发展。该数据集聚焦于挪威杂货店场景，包含248张货架图像与22,731个边界框标注，涵盖356种商品类别，并额外提供327种商品的多角度参考图像。其核心研究问题在于解决复杂零售环境中密集、遮挡及多样商品的高精度检测，为库存管理、自动结算等应用提供关键数据支撑，显著促进了零售视觉分析领域的实证研究。

当前挑战

该数据集首要挑战在于应对零售场景中商品检测的固有难题：货架商品常呈现高密度排列、部分遮挡、光照不均及包装相似性，导致传统检测模型易产生误检与漏检。构建过程中，标注工作面临大规模商品类别细粒度划分的复杂性，需准确关联数千个边界框与具体商品条码，并处理未知商品类别；同时，数据采集需在真实商店环境中保持图像质量与标注一致性，克服实际运营干扰，确保数据集的可靠性与代表性。

常用场景

经典使用场景

在零售智能化的背景下，norwegian-grocery数据集为挪威杂货店货架图像提供了精细标注，其经典使用场景集中于商品检测与识别任务。该数据集支持COCO和YOLO两种主流标注格式，便于研究者直接应用于目标检测模型的训练与评估，尤其在零售环境下的多商品密集排列场景中，能够有效测试模型在复杂背景下的定位与分类性能。

解决学术问题

该数据集主要解决了零售视觉分析中的关键学术问题，包括小样本学习、跨域适应以及密集场景下的目标检测挑战。通过提供356个产品类别和超过2.2万个边界框标注，它为模型在真实世界杂货店环境中的泛化能力评估提供了基准，推动了细粒度识别和遮挡处理等研究方向的发展，对计算机视觉在零售领域的应用具有重要理论意义。

衍生相关工作

围绕该数据集，已衍生出多项经典研究工作，主要集中在基于YOLO和Faster R-CNN架构的零售商品检测模型优化。这些工作利用数据集的多角度产品参考图像，探索了零样本学习和跨模态对齐方法，进一步推动了零售场景下的视觉识别技术发展，并为后续的竞赛和学术研究提供了可复现的基准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集