Densely Segmented Supermarket (D2S) dataset

Name: Densely Segmented Supermarket (D2S) dataset
Creator: MVTec Software GmbH
Published: 2018-07-25 23:50:26
License: 暂无描述

arXiv2018-07-25 更新2024-06-21 收录

下载链接：

https://www.mvtec.com/research

下载链接

链接失效反馈

官方服务：

资源简介：

D2S数据集是一个专为工业领域实例感知语义分割设计的新型基准，包含21000张高分辨率图像，每张图像都有像素级的所有对象实例标签。该数据集涵盖了60个类别的日常商品，如水果、蔬菜、谷物包装、意大利面和瓶子等。数据集的训练图像仅包含单一类别对象，背景均匀，而验证和测试集则更为复杂多样。D2S数据集旨在模拟自动结账、库存或仓库系统的真实世界设置，通过不同的光照、旋转和背景变化来进一步测试实例分割方法的鲁棒性。数据集的标注精确无误，允许使用单个实例的裁剪进行人工数据增强。D2S数据集覆盖了该领域中几个高度相关的挑战，如有限的训练数据量和测试及验证集的高度多样性。

The D2S dataset is a novel benchmark tailored for industrial instance-aware semantic segmentation, consisting of 21,000 high-resolution images, each annotated with pixel-level instance labels for all objects present in the image. This dataset encompasses 60 categories of daily commodities, including fruits, vegetables, cereal packages, pasta, bottles and other similar everyday items. The training images of the dataset only contain single-category objects with uniform backgrounds, whereas the validation and test sets are far more complex and diverse. The D2S dataset is intended to simulate real-world scenarios of self-checkout, inventory management or warehouse systems, and evaluates the robustness of instance segmentation methods by incorporating variations in lighting, rotation and background conditions. The annotations of the D2S dataset are meticulously precise, allowing for manual data augmentation through cropping of individual object instances. This benchmark addresses several highly relevant challenges in the field, including limited training data scale and the pronounced diversity of the validation and test sets.

提供机构：

MVTec Software GmbH

创建时间：

2018-04-23

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，面向工业应用的实例分割数据集相对稀缺。Densely Segmented Supermarket (D2S) 数据集通过精心设计的采集流程构建而成，旨在模拟自动结账、库存管理等真实工业场景。数据采集采用自动化与人工布置相结合的方式，在受控环境下使用高分辨率工业相机拍摄。核心构建策略基于场景划分：每个场景的物体摆放固定后，通过转台进行十次等角度旋转，并在每种旋转姿态下采集三种不同光照条件的图像。训练集、验证集和测试集的划分严格遵循工业应用逻辑，训练集仅包含单一类别物体置于均匀背景的简单场景，而验证集与测试集则引入了多类别物体、复杂背景、遮挡及未见过的干扰物，以全面评估模型的泛化与鲁棒性。整个数据集包含700个不同场景，共计21,000张高质量图像。

特点

D2S 数据集在实例分割领域展现出鲜明的特色。其首要特点是高度的标注质量与一致性，所有图像中的每个物体实例均由专家进行像素级精确标注，确保了标注的完整性与无歧义性，理论上允许完美算法达到100%的平均精度。其次，数据集在类别分布上呈现出高度均匀性，涵盖60类日常杂货商品，每类样本数量均衡，避免了常见数据集中类别不平衡带来的评估偏差。再者，数据集通过系统性的变量控制引入了丰富的挑战性，包括物体旋转、光照变化、复杂背景、不同程度遮挡以及训练集中未出现的干扰物体，这些因素共同模拟了工业部署中的复杂环境。最后，其独特的划分方式——训练集简单而验证测试集复杂——直接对应了工业应用中训练数据有限但需应对复杂场景的核心难题。

使用方法

该数据集主要服务于实例感知语义分割算法的开发、训练与基准测试。研究人员可利用其提供的精细标注，训练如 Mask R-CNN、FCIS 等先进的实例分割模型。使用流程通常始于对训练集图像的模型训练，鉴于训练集规模有限且场景简单，鼓励采用数据增强技术，例如利用数据集中提供的像素级标注，通过裁剪单个实例并随机合成新图像来人工扩充训练数据，论文中证明此举能显著提升模型性能。随后，在复杂度更高的验证集上进行超参数调优与模型选择。最终，模型在最具挑战性的测试集上进行评估，使用与 COCO 数据集一致的平均精度均值作为核心评估指标，以衡量模型在多变光照、旋转、背景及遮挡下的综合表现。数据集的结构设计也支持对模型旋转不变性、光照鲁棒性及对新物体干扰的抵抗能力进行专项分析。

背景与挑战

背景概述

在计算机视觉领域，实例感知语义分割作为图像理解的核心任务，其发展高度依赖于高质量标注数据集的支撑。MVTec D2S数据集由MVTec Software GmbH与慕尼黑工业大学的研究团队于2018年联合发布，旨在为工业场景下的实例分割任务提供精准的基准测试平台。该数据集聚焦于自动结账、库存管理与仓储系统等实际应用，收录了涵盖60类日常商品的21000张高分辨率图像，每张图像均提供了像素级的实例标注。通过精心设计的训练集与测试集分布差异，D2S模拟了工业环境中训练数据稀缺而测试场景复杂的真实挑战，为实例分割算法的鲁棒性与泛化能力评估设立了新的标准。

当前挑战

D2S数据集所应对的核心挑战在于工业场景下的实例分割任务，其难点主要体现在高度相似的物体类别区分、复杂遮挡与光照变化下的精确分割，以及训练数据极度有限条件下的模型泛化。在构建过程中，研究团队面临多重挑战：首先，为确保标注的一致性与完整性，需对超过七万个物体实例进行像素级精细标注，避免标签歧义；其次，为模拟真实工业环境，数据集需涵盖多种背景、旋转角度、光照条件及遮挡场景，这要求精密的采集系统设计与自动化流程；此外，训练集与测试集的有意差异化分布——训练集仅包含单一类别与均匀背景，而测试集则呈现多类别、多背景与高遮挡的复杂场景——旨在推动算法在数据稀缺条件下的性能突破，这对现有深度学习方法的适应能力提出了严峻考验。

常用场景

经典使用场景

在计算机视觉领域，密集分割超市（D2S）数据集为实例感知语义分割任务提供了工业级基准。该数据集通过模拟自动结账、库存管理或仓库系统的真实场景，构建了包含21000张高分辨率图像的集合，涵盖60类日常商品。其训练集仅包含单一类别对象在均匀背景下的图像，而验证集和测试集则引入了复杂的光照变化、旋转角度及多样背景，旨在评估算法在有限训练数据下的泛化能力与鲁棒性。

衍生相关工作

基于D2S数据集，多项经典研究工作得以推进，尤其在数据增强与小样本实例分割领域。例如，研究团队利用其高质量标注生成人工增强训练集，显著提升了Mask R-CNN等模型的性能。该数据集还激发了针对旋转不变性、光照鲁棒性及遮挡处理的新型网络架构探索，并为生成对抗网络在合成训练数据中的应用提供了验证基准，推动了工业视觉算法的实用化发展。

数据集最近研究