VISION Datasets

Name: VISION Datasets
Creator: 佐治亚理工学院
Published: 2023-06-18 09:11:04
License: 暂无描述

arXiv2023-06-18 更新2024-06-21 收录

下载链接：

https://huggingface.co/datasets/VISION-Workshop/VISION-Datasets

下载链接

链接失效反馈

官方服务：

资源简介：

VISION Datasets是由佐治亚理工学院等机构创建的一套包含14个工业检测数据集的集合，旨在解决工业视觉检测中的数据可用性、质量和复杂生产需求等问题。该数据集包含18,000张图像，涵盖44种缺陷类型，支持多种检测方法，如无监督、弱监督、半监督和监督缺陷检测。数据集通过实例分割标注，精确识别缺陷，适用于多种制造过程、材料和行业。此外，VISION Datasets还支持两项挑战竞赛，旨在推动工业视觉检测技术的进步，解决实际生产中的复杂问题。

VISION Datasets is a collection of 14 industrial inspection datasets created by institutions such as the Georgia Institute of Technology, with the goal of addressing challenges including data availability, quality issues, and complex production requirements in industrial visual inspection. This collection comprises 18,000 images spanning 44 defect categories, and supports a variety of inspection approaches, namely unsupervised, weakly-supervised, semi-supervised, and supervised defect detection. Annotated through instance segmentation, the datasets allow for accurate identification of defects, making them applicable across diverse manufacturing processes, materials, and industrial sectors. Furthermore, VISION Datasets also features two challenge competitions, intended to promote the advancement of industrial visual inspection technologies and resolve complex practical problems in production.

提供机构：

佐治亚理工学院

创建时间：

2023-06-14

搜集汇总

数据集介绍

构建方式

VISION Datasets的构建，是为了应对现实工业场景中的数据可用性、数据质量和生产要求复杂性等挑战。该数据集由14个工业检测数据集组成，涵盖了广泛的制造过程、材料和行业。VISION Datasets提供了训练、验证和测试分割的标注掩码，支持无监督、弱监督、半监督和监督缺陷检测方法。此外，该数据集还提供了实例分割标注，能够精确识别缺陷。总共有18k张图像，涵盖了44种缺陷类型，旨在模拟广泛的实际生产场景。

使用方法

使用VISION Datasets的方法包括：1. 数据准备：数据集的下载和安装需要遵循提供的指导。2. 数据加载：使用相应的数据加载器加载数据集，确保数据集被正确地分割为训练、验证和测试集。3. 模型训练：使用数据集训练缺陷检测模型，可以使用各种深度学习框架，如TensorFlow或PyTorch。4. 模型评估：在验证集上评估模型的性能，可以使用各种指标，如平均精度（mAP）和平均召回率（mAR）。5. 模型测试：在测试集上测试模型的性能，以评估模型在实际生产场景中的表现。

背景与挑战

背景概述

随着基于视觉的检测算法在公开数据集上的性能日益提升，实际工业场景中数据可用性、质量和生产要求的复杂性等挑战却常常被忽视。为了解决这些问题，研究人员开发了VISION Datasets，这是一个包含14个工业检测数据集的多样化集合，旨在应对数据可用性、数据质量和复杂生产要求等方面的挑战。VISION Datasets提供了广泛的标注掩码，涵盖了所有分割，并支持各种检测方法。此外，该数据集还具备实例分割标注，能够精确识别缺陷。VISION Datasets总共包含18k张图像，涵盖了44种缺陷类型，旨在反映广泛的实际生产场景。

当前挑战

VISION Datasets面临的主要挑战包括：1) 实际工业场景中数据可用性、质量和生产要求的复杂性；2) 构建数据集过程中遇到的挑战，如数据一致性、准确性和质量控制等。此外，VISION Datasets还需要应对产品多样性和表面检测任务的多样性，以及不同缺陷类型之间的不平衡。为了解决这些问题，研究人员提出了数据增强和生成技术，如数据清洗、数据增强、合成数据生成等。通过举办挑战竞赛，VISION Datasets希望能够推动基于视觉的工业检测算法的发展，并促进学术研究与工业实践之间的交流。

常用场景

经典使用场景

VISION Datasets作为工业视觉检测领域的基准数据集，其经典使用场景在于为研究人员和从业者提供一个多样化的工业检测数据集，以应对实际工业场景中的数据可用性、数据质量和生产要求复杂性的挑战。VISION Datasets包含了14个工业检测数据集，覆盖了广泛的制造过程、材料和行业，总计有18k张图片和44种缺陷类型。这些数据集提供了全面的标注，包括所有分割的标注掩码，支持各种检测方法，如无监督、弱监督、半监督和监督缺陷检测。此外，VISION Datasets还提供了实例分割标注，使得研究人员能够精确地识别缺陷。这些特点使得VISION Datasets成为评估和开发视觉检测算法的理想选择。

解决学术问题

VISION Datasets解决了现有数据集在模拟实际工业场景复杂性方面的不足。现有的数据集往往集中在单一产品或检测方法上，缺乏对多样化工业场景的全面覆盖。VISION Datasets通过提供14个工业检测数据集，涵盖了从布料到电子元件等多种产品类型，以及44种不同的缺陷类型，极大地增强了数据集的多样性和实用性。此外，VISION Datasets还提供了实例分割标注，解决了现有数据集在缺陷识别中的模糊边界问题，使得研究人员能够更精确地定位和识别缺陷。这些改进对于推动视觉检测算法在工业领域的应用具有重要意义。

实际应用

VISION Datasets在实际应用中，为工业视觉检测提供了重要的数据资源。通过模拟实际生产场景中的数据可用性和标注情况，VISION Datasets能够帮助研究人员开发出更高效的算法，以应对有限的训练数据和标注情况。此外，VISION Datasets还提供了实例分割标注，使得检测系统能够更精确地识别缺陷，从而提高产品质量并降低生产成本。VISION Datasets的实际应用场景包括但不限于电子元件检测、布料缺陷检测、汽车零部件检测等，为工业生产中的质量控制提供了有力支持。

数据集最近研究