Synthetic Industrial Parts dataset (SIP-17)

Name: Synthetic Industrial Parts dataset (SIP-17)
Creator: 斯堪尼亚CV AB、斯科夫德大学、皇家理工学院
Published: 2024-04-13 03:04:59
License: 暂无描述

arXiv2024-04-13 更新2024-06-21 收录

下载链接：

https://www.kaggle.com/datasets/mandymm/syntheticindustrial-parts-dataset-sip-17

下载链接

链接失效反馈

官方服务：

资源简介：

SIP-17数据集由皇家理工学院等机构创建，包含17个代表六个工业用例的物体，用于模拟到真实的工业零件分类挑战。数据集大小为66000个标记的合成图像，用于训练和验证，以及566个未标记的真实图像用于测试。数据集创建过程中采用了域随机化技术，包括随机背景和后处理，以模拟广泛的可能场景。该数据集主要应用于工业零件分类和质量检测，旨在解决训练深度神经网络时缺乏大量标注数据的问题。

The SIP-17 dataset was developed by institutions including the Royal Institute of Technology. It comprises 17 objects representing six industrial use cases, and is tailored for sim-to-real industrial part classification challenges. The dataset includes 66,000 labeled synthetic images for training and validation, plus 566 unlabeled real-world images for testing. During its creation, domain randomization techniques encompassing random backgrounds and post-processing were adopted to simulate a broad spectrum of possible scenarios. This dataset is primarily utilized for industrial part classification and quality inspection, with the goal of alleviating the scarcity of large-scale labeled data during deep neural network training.

提供机构：

斯堪尼亚CV AB、斯科夫德大学、皇家理工学院

创建时间：

2024-04-13

搜集汇总

数据集介绍

构建方式

在工业视觉领域，合成数据为克服真实标注数据稀缺提供了创新路径。SIP-17数据集的构建严格遵循领域随机化技术，通过渲染17个工业零件的CAD模型生成合成图像。具体流程包含两个版本：Syn O版本在可控环境下渲染，仅变化相机角度与光照；Syn R版本则进一步引入随机背景与后处理技术，如色彩调整与模糊噪声，以模拟真实工业场景的复杂性。每个类别生成1200张训练图像与300张验证图像，总计合成数据规模达66K，旨在系统评估领域随机化对缩小仿真与现实间域差距的效用。

使用方法

SIP-17数据集旨在作为仿真到现实工业零件分类研究的基准测试平台。其标准使用范式为：仅使用合成数据（Syn R或Syn O）进行模型训练与验证，而后在未经任何真实数据训练的566张真实工业图像上进行测试，以此严格评估模型的跨域泛化能力。研究人员可基于此框架，对比不同网络架构（如CNN、Vision Transformer及自监督模型）在应对反照率相似、局部相似及装配对齐等挑战性用例时的性能差异。数据集公开可用，为探索仅依赖合成数据训练的分类模型在真实工业环境中的可行性提供了标准化评估基础。

背景与挑战

背景概述

在工业自动化与智能制造领域，高效可靠的零部件分类技术对于物料分拣、质量检测等关键流程至关重要。然而，深度学习模型训练通常依赖大量标注数据，这在工业场景中获取成本高昂且耗时。为应对这一挑战，斯堪尼亚公司、斯考夫德大学与皇家理工学院的研究团队于2024年共同创建了SIP-17合成工业零件数据集。该数据集聚焦于仿真到现实的跨域分类问题，包含来自六个工业用例的17类对象，涵盖孤立零件与装配体，旨在为仅使用合成数据训练、在真实场景测试的工业零件分类研究提供基准测试平台。其通过领域随机化技术生成的两类合成图像，为探索合成数据在工业视觉任务中的可行性奠定了重要基础。

当前挑战

SIP-17数据集所应对的核心领域挑战在于仿真到现实的工业零件跨域分类，其难点主要体现为合成数据与真实图像间的领域差距。具体而言，数据构建过程中的挑战包括：如何通过领域随机化技术有效模拟真实工业环境中的光照、背景及后处理变化，以增强模型的泛化能力。在分类任务本身，数据集突出了两大挑战：一是对具有相似反照率或简单形状的零件进行区分，例如黑色钩状零件与插头在真实图像中易混淆；二是对部分相似或存在细微装配差异的零件进行精准识别，例如齿轮变体间或带有螺丝的轮毂装配体，模型难以捕捉其细微的语义差异与对齐关系，导致分类性能显著下降。

常用场景

经典使用场景

在工业视觉领域，合成数据与真实数据之间的领域鸿沟是制约深度学习模型实际部署的关键瓶颈。SIP-17数据集通过精心设计的六类工业用例，构建了一个从仿真到现实的分类测试平台。其经典使用场景在于，研究者可以仅利用该数据集提供的合成图像训练深度神经网络，随后在未经训练的真实工业图像上进行评估，从而系统性探索模型在跨域条件下的泛化能力与鲁棒性。这种设置直接模拟了制造业中常见但数据稀缺的场景，为算法在真实工业环境中的可行性提供了预验证。

解决学术问题

该数据集主要致力于解决合成数据训练模型在真实工业场景中泛化性能不足的核心学术问题。传统Sim-to-Real基准多聚焦于通用物体，难以捕捉工业零件在形状、反照率及装配对齐上的细微差异。SIP-17通过纳入具有高度相似性的孤立零件和装配体，精确建模了工业分类中的挑战性子类别。它使得研究者能够定量分析领域随机化、模型架构（如CNN与Transformer）以及自监督学习策略在缓解领域偏移上的效果，从而为合成数据在工业视觉中的有效利用提供了实证依据与理论洞察。

实际应用

在工业制造的实际流程中，SIP-17数据集的应用价值体现在多个环节。例如，在卡车驾驶室装配线、物流拣选站、车轮与发动机装配质量检测等场景中，该数据集能够支持开发仅依赖CAD模型生成的合成数据进行训练的自动分类系统。制造商可在物理生产线部署前，利用此类系统进行零件分拣验证或装配正确性检查，从而规避昂贵且耗时的真实数据采集与标注过程。这显著提升了生产流程的灵活性与自动化水平，尤其适用于产品迭代快速、零件种类繁多的现代柔性制造环境。

数据集最近研究