five

MVTec-FS Dataset|缺陷检测数据集|少样本学习数据集

收藏
github2024-12-26 更新2024-12-30 收录
缺陷检测
少样本学习
下载链接:
https://github.com/ShuaiLYU/MVTec-FS
下载链接
链接失效反馈
资源简介:
MVTec-FS数据集是MVTec AD数据集的改进版本,专门为少样本学习研究设计。当前异常检测任务主要关注缺陷定位,而针对缺陷类型分类的数据集较少。为了解决这一问题,我们对MVTec AD数据集进行了重新处理,创建了一个适合少样本缺陷分类任务的基准。此外,它还可用于少样本目标检测和统一多模态分类。
创建时间:
2024-12-22
原始信息汇总

MVTec-FS 数据集概述

数据集简介

MVTec-FS 数据集是基于 MVTec AD 数据集改进的版本,专门用于少样本学习研究。该数据集旨在填补缺陷类型分类数据集的空白,适用于少样本缺陷分类任务、少样本目标检测和统一多模态分类。

主要特点

  • 使用连通组件算法和手动细化从原始图像级注释创建实例级注释。
  • 包含多类异常,并为每个缺陷实例提供校正后的类别标签。
  • 适用于 1-shot、3-shot 和 5-shot 学习范式。
  • 包含 14 个子数据集,代表具有不同异常特征的各种产品类别。

数据集结构

数据集包含每个子数据集的训练集和测试集。每个子数据集包括异常类别和实例数量,详细信息见 Table 1

注释细节

  • 原始粗糙的图像级注释被细化为实例级注释。
  • 使用连通组件算法生成实例掩码。
  • 通过手动审查和调整确保每个缺陷实例的类别标签准确。

使用方式

数据集格式

数据集按子数据集组织,每个子数据集包含训练和测试图像的独立目录。每张图像都有一个对应的 json 文件(labeme 格式)。

加载数据集

可以使用常见的深度学习库(如 PyTorch 或 TensorFlow)加载数据集。示例代码片段将在仓库中提供。

少样本学习实验

使用数据集进行少样本学习的步骤:

  1. 从训练集中采样创建支持集。
  2. 使用测试集作为查询集进行评估。

数据集支持:

  • 1-shot 学习
  • 3-shot 学习
  • 5-shot 学习

引用

如果在研究中使用 MVTec-FS,请引用: MVREC: A General Few-shot Defect Classification Model Using Multi-View Region-Context (AAAI 2025)

许可证

遵循 MVTec AD,数据集在 CC BY-NC-SA 4.0 下分发。

联系方式

如有关于数据集的问题或疑问,请联系:

  • 姓名:LYU Shuai
  • 邮箱:shuai.lyu@connect.polyu.hk
AI搜集汇总
数据集介绍
main_image_url
构建方式
MVTec-FS数据集是基于MVTec AD数据集进行重构的,专门为少样本学习研究设计。通过对MVTec AD数据集中的图像级标注进行精细化处理,使用连通组件算法生成实例级掩码,并经过人工审核和调整,确保每个缺陷实例的类别标签准确无误。这一过程不仅提升了标注的精确性,还为少样本缺陷分类任务提供了可靠的基准。
使用方法
MVTec-FS数据集的使用方法包括加载数据集和进行少样本学习实验。数据集按子数据集组织,每个子数据集包含训练和测试图像目录,每张图像对应一个json格式的标注文件。可以使用PyTorch或TensorFlow等深度学习库加载数据集。进行少样本学习实验时,从训练集中采样创建支持集,并使用测试集作为查询集进行评估。数据集支持1-shot、3-shot和5-shot学习范式。
背景与挑战
背景概述
MVTec-FS数据集是基于MVTec AD数据集优化而来的,专为少样本学习研究设计,旨在填补缺陷类型分类领域的数据集空白。该数据集由MVREC研究团队在2025年AAAI会议上首次提出,主要应用于少样本缺陷分类任务。MVTec-FS不仅继承了MVTec AD的多样化产品类别和异常特征,还通过实例级标注和多模态分类能力,为少样本学习提供了更精细的基准。其14个子数据集涵盖了多种工业产品类别,适用于1-shot、3-shot和5-shot学习范式,推动了缺陷分类研究的发展。
当前挑战
MVTec-FS数据集在解决缺陷分类问题时面临多重挑战。首先,缺陷类型分类任务本身具有复杂性,尤其是在少样本学习场景下,模型需要从极少量样本中提取有效特征并进行准确分类。其次,数据集的构建过程中,原始图像级标注需通过连通域算法和人工修正转化为实例级标注,这一过程既耗时又容易引入误差。此外,多模态分类任务的引入增加了数据处理的复杂性,要求模型能够同时处理多种数据形式。这些挑战共同构成了MVTec-FS数据集在应用与研究中的核心难点。
常用场景
经典使用场景
MVTec-FS数据集在少样本学习领域具有重要应用,特别是在缺陷分类任务中。该数据集通过对MVTec AD数据集的重新处理,生成了适用于少样本学习的实例级标注,涵盖了14个不同产品类别的异常特征。研究人员可以利用该数据集进行1-shot、3-shot和5-shot学习实验,探索在有限样本下如何有效分类不同类型的缺陷。
解决学术问题
MVTec-FS数据集解决了少样本学习在缺陷分类中的关键问题。传统异常检测任务主要关注缺陷定位,而针对缺陷类型分类的数据集较为稀缺。该数据集通过提供多类别异常实例的精确标注,为少样本学习模型提供了可靠的基准,推动了缺陷分类算法的研究与发展。
实际应用
在实际应用中,MVTec-FS数据集可广泛应用于工业制造领域,特别是在自动化质量检测系统中。通过利用该数据集训练的少样本学习模型,企业能够在生产线上快速识别和分类产品缺陷,提高检测效率并降低人工成本。此外,该数据集还可用于多模态分类任务,进一步提升缺陷检测的准确性。
数据集最近研究
最新研究方向
在工业缺陷检测领域,MVTec-FS数据集的推出为少样本学习研究提供了新的基准。该数据集通过对MVTec AD数据集的精细处理,特别针对缺陷类型分类任务进行了优化,填补了当前异常检测任务中缺陷定位与分类之间的空白。MVTec-FS不仅支持少样本缺陷分类,还可应用于少样本目标检测和多模态统一分类,为工业视觉系统的智能化发展提供了重要支持。其多类别异常标注和实例级注释的引入,使得该数据集在1-shot、3-shot和5-shot学习范式中展现出显著优势,推动了工业缺陷检测技术在复杂场景下的应用与创新。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

PQAref

PQAref数据集是一个用于生物医学领域参考问答任务的数据集,旨在微调大型语言模型。该数据集包含三个部分:指令(问题)、摘要(从PubMed检索的相关摘要,包含PubMed ID、摘要标题和内容)和答案(预期答案,包含PubMed ID形式的参考)。数据集通过半自动方式创建,利用了PubMedQA数据集中的问题。

huggingface 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

CT-ORG

3D CT, 140 Cases, 6 Categories of Organ Segmentation.

github 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录