norwegian-grocery
收藏Hugging Face2026-04-06 更新2026-04-07 收录
下载链接:
https://huggingface.co/datasets/valiantlynxz/norwegian-grocery
下载链接
链接失效反馈官方服务:
资源简介:
NorgesGruppen Grocery Detection Dataset 是一个用于挪威杂货店货架图像的目标检测数据集,源自NorgesGruppen Data竞赛。数据集包含248张货架图像,22,731个COCO格式的边界框标注,涵盖356个产品类别(包括未知产品类别)。此外,数据集还提供了327种产品的多角度参考照片,共计1,582张图像。数据集支持COCO和YOLO两种格式,其中YOLO格式在加载时自动转换。数据集分为训练集和验证集,比例为85:15。适用于目标检测和图像分类任务,特别是零售和货架检测场景。数据集还包含产品元数据,如条形码、产品名称和图像类型。
创建时间:
2026-03-26
原始信息汇总
数据集概述
基本信息
- 数据集名称: NorgesGruppen Grocery Detection Dataset
- 托管地址: https://huggingface.co/datasets/valiantlynxz/norwegian-grocery
- 许可证: cc-by-nc-4.0
- 任务类别: 目标检测、图像分类
- 语言: 挪威语 (no)
- 标签: grocery, retail, shelf-detection, coco, yolo, norgesgruppen
- 规模类别: n<1K
数据集内容
- 货架图像: 248张来自挪威杂货店的货架图像(Egg, Frokost, Knekkebrod, Varmedrikker类别)。
- 边界框标注: 22,731个COCO格式的边界框标注。
- 产品类别: 356个产品类别(ID 0-355,其中355为
unknown_product)。 - 产品参考图像: 327个产品的多角度参考照片,总计1,582张图像。
- 训练/验证集划分: 211张训练图像,37张验证图像(85/15比例,随机种子为42)。
数据配置
数据集提供三种配置,可通过Hugging Face datasets库加载。
| 配置名称 | 默认 | 描述 | 数据划分 |
|---|---|---|---|
coco |
是 | 原始的COCO格式标注,包含完整元数据 | train, validation |
yolo |
否 | 自动转换为YOLO归一化格式[cx, cy, w, h] |
train, validation |
products |
否 | 产品参考图像及其元数据 | train |
COCO 配置
每个样本包含货架图像及其COCO格式标注。
image: PIL Image对象。image_id: 整数。width: 图像宽度(像素)。height: 图像高度(像素)。annotations: COCO标注列表的JSON字符串。每个标注包含id、category_id、bbox(格式为[x, y, w, h],单位为像素)、area、product_code等字段。
YOLO 配置
使用相同的图像,但边界框自动转换为YOLO归一化中心格式。
image: PIL Image对象。image_id: 整数。labels: 整数列表,表示类别ID。bboxes: 列表的列表,格式为[[cx, cy, w, h], ...],坐标已归一化到[0, 1]范围。
Products 配置
按产品代码组织的327个产品的参考图像。
image: PIL Image对象(一个角度)。product_code: 条形码字符串。product_name: 产品名称字符串。image_type: 图像角度类型,如"main"、"front"、"back"、"left"、"right"、"top"、"bottom"。annotation_count: 该产品在货架图像中出现的次数。
数据结构
norwegian_grocery.py # 自定义加载脚本(由HF自动发现) train/ annotations.json # COCO格式的标注文件 images/ # 248张货架图像(.jpg/.jpeg格式) NM_NGD_product_images/ metadata.json # 产品名称、条形码、标注次数的元数据 {barcode}/ # 按条形码组织的产品参考图像 scripts/ coco_to_yolo.py # 将COCO格式转换为YOLO格式的脚本(包含训练/验证集划分)
关键统计
- 图像尺寸范围: 宽度481-5712像素,高度399-4624像素。
- 平均标注数: 每张图像约92个标注。
- 最常见类别:
unknown_product(ID 355),共422个标注。 - 产品参考图像总数: 1,582张,涵盖327个产品。
使用说明
- 可通过提供的Python脚本
scripts/coco_to_yolo.py在本地生成适用于YOLO训练的文件结构。 - 数据集与https://github.com/kuben-labs/nmai中的检测项目兼容。
搜集汇总
数据集介绍

构建方式
在零售计算机视觉领域,挪威杂货检测数据集源自NorgesGruppen数据竞赛,系统性地采集了挪威杂货店货架图像。该数据集包含248张货架图像,涵盖鸡蛋、早餐、脆面包和热饮等商品类别,并采用COCO格式标注了22,731个边界框,涉及356种产品类别。构建过程中,通过人工或半自动方式对图像中的商品进行精细标注,确保每个边界框均关联产品条形码与名称,同时为327种商品提供了多角度参考图像,共计1,582张,以支持更全面的模型训练与验证。
特点
该数据集显著特点在于其专注于挪威零售环境,提供了丰富的多格式标注支持。除了标准的COCO格式外,数据集通过动态转换机制,可直接加载为YOLO归一化中心坐标格式,无需额外预处理。数据集包含大量未知产品类别标注,增强了现实场景下的鲁棒性训练潜力。此外,配套的多角度商品参考图像库,为细粒度识别与跨视角分析提供了独特资源,图像分辨率多样,标注密度较高,平均每张图像包含约92个标注,反映了真实货架的复杂商品布局。
使用方法
利用Hugging Face的datasets库,用户可便捷加载不同配置的数据集。默认加载COCO格式,包含原始图像、标注及元数据;通过指定name参数为'yolo',可自动获取转换为YOLO格式的数据,边界框已归一化;而'products'配置则提供商品参考图像及其元数据。对于本地YOLO训练,可使用附带的Python脚本将COCO标注转换为标准YOLO目录结构。数据集已预设训练与验证分割,可直接用于目标检测或图像分类模型的开发与评估。
背景与挑战
背景概述
在零售智能化与计算机视觉交叉领域,挪威杂货检测数据集(Norwegian Grocery)由NorgesGruppen于数据竞赛中创建,旨在推动货架商品自动识别技术发展。该数据集聚焦于挪威杂货店场景,包含248张货架图像与22,731个边界框标注,涵盖356种商品类别,并额外提供327种商品的多角度参考图像。其核心研究问题在于解决复杂零售环境中密集、遮挡及多样商品的高精度检测,为库存管理、自动结算等应用提供关键数据支撑,显著促进了零售视觉分析领域的实证研究。
当前挑战
该数据集首要挑战在于应对零售场景中商品检测的固有难题:货架商品常呈现高密度排列、部分遮挡、光照不均及包装相似性,导致传统检测模型易产生误检与漏检。构建过程中,标注工作面临大规模商品类别细粒度划分的复杂性,需准确关联数千个边界框与具体商品条码,并处理未知商品类别;同时,数据采集需在真实商店环境中保持图像质量与标注一致性,克服实际运营干扰,确保数据集的可靠性与代表性。
常用场景
经典使用场景
在零售智能化的背景下,norwegian-grocery数据集为挪威杂货店货架图像提供了精细标注,其经典使用场景集中于商品检测与识别任务。该数据集支持COCO和YOLO两种主流标注格式,便于研究者直接应用于目标检测模型的训练与评估,尤其在零售环境下的多商品密集排列场景中,能够有效测试模型在复杂背景下的定位与分类性能。
解决学术问题
该数据集主要解决了零售视觉分析中的关键学术问题,包括小样本学习、跨域适应以及密集场景下的目标检测挑战。通过提供356个产品类别和超过2.2万个边界框标注,它为模型在真实世界杂货店环境中的泛化能力评估提供了基准,推动了细粒度识别和遮挡处理等研究方向的发展,对计算机视觉在零售领域的应用具有重要理论意义。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在基于YOLO和Faster R-CNN架构的零售商品检测模型优化。这些工作利用数据集的多角度产品参考图像,探索了零样本学习和跨模态对齐方法,进一步推动了零售场景下的视觉识别技术发展,并为后续的竞赛和学术研究提供了可复现的基准。
以上内容由遇见数据集搜集并总结生成



