MVTec-FS Dataset
收藏github2024-12-26 更新2024-12-30 收录
下载链接:
https://github.com/ShuaiLYU/MVTec-FS
下载链接
链接失效反馈官方服务:
资源简介:
MVTec-FS数据集是MVTec AD数据集的改进版本,专门为少样本学习研究设计。当前异常检测任务主要关注缺陷定位,而针对缺陷类型分类的数据集较少。为了解决这一问题,我们对MVTec AD数据集进行了重新处理,创建了一个适合少样本缺陷分类任务的基准。此外,它还可用于少样本目标检测和统一多模态分类。
MVTec-FS dataset is an improved version of the MVTec AD dataset, specifically designed for few-shot learning research. Currently, most anomaly detection tasks prioritize defect localization, yet there is a scarcity of datasets focused on defect type classification. To address this research gap, we reprocessed the MVTec AD dataset to develop a benchmark suitable for few-shot defect classification tasks. Furthermore, this dataset can also be utilized for few-shot object detection and unified multimodal classification.
创建时间:
2024-12-22
原始信息汇总
MVTec-FS 数据集概述
数据集简介
MVTec-FS 数据集是基于 MVTec AD 数据集改进的版本,专门用于少样本学习研究。该数据集旨在填补缺陷类型分类数据集的空白,适用于少样本缺陷分类任务、少样本目标检测和统一多模态分类。
主要特点
- 使用连通组件算法和手动细化从原始图像级注释创建实例级注释。
- 包含多类异常,并为每个缺陷实例提供校正后的类别标签。
- 适用于 1-shot、3-shot 和 5-shot 学习范式。
- 包含 14 个子数据集,代表具有不同异常特征的各种产品类别。
数据集结构
数据集包含每个子数据集的训练集和测试集。每个子数据集包括异常类别和实例数量,详细信息见 Table 1。
注释细节
- 原始粗糙的图像级注释被细化为实例级注释。
- 使用连通组件算法生成实例掩码。
- 通过手动审查和调整确保每个缺陷实例的类别标签准确。
使用方式
数据集格式
数据集按子数据集组织,每个子数据集包含训练和测试图像的独立目录。每张图像都有一个对应的 json 文件(labeme 格式)。
加载数据集
可以使用常见的深度学习库(如 PyTorch 或 TensorFlow)加载数据集。示例代码片段将在仓库中提供。
少样本学习实验
使用数据集进行少样本学习的步骤:
- 从训练集中采样创建支持集。
- 使用测试集作为查询集进行评估。
数据集支持:
- 1-shot 学习
- 3-shot 学习
- 5-shot 学习
引用
如果在研究中使用 MVTec-FS,请引用: MVREC: A General Few-shot Defect Classification Model Using Multi-View Region-Context (AAAI 2025)
许可证
遵循 MVTec AD,数据集在 CC BY-NC-SA 4.0 下分发。
联系方式
如有关于数据集的问题或疑问,请联系:
- 姓名:LYU Shuai
- 邮箱:shuai.lyu@connect.polyu.hk
搜集汇总
数据集介绍

构建方式
MVTec-FS数据集是基于MVTec AD数据集进行重构的,专门为少样本学习研究设计。通过对MVTec AD数据集中的图像级标注进行精细化处理,使用连通组件算法生成实例级掩码,并经过人工审核和调整,确保每个缺陷实例的类别标签准确无误。这一过程不仅提升了标注的精确性,还为少样本缺陷分类任务提供了可靠的基准。
使用方法
MVTec-FS数据集的使用方法包括加载数据集和进行少样本学习实验。数据集按子数据集组织,每个子数据集包含训练和测试图像目录,每张图像对应一个json格式的标注文件。可以使用PyTorch或TensorFlow等深度学习库加载数据集。进行少样本学习实验时,从训练集中采样创建支持集,并使用测试集作为查询集进行评估。数据集支持1-shot、3-shot和5-shot学习范式。
背景与挑战
背景概述
MVTec-FS数据集是基于MVTec AD数据集优化而来的,专为少样本学习研究设计,旨在填补缺陷类型分类领域的数据集空白。该数据集由MVREC研究团队在2025年AAAI会议上首次提出,主要应用于少样本缺陷分类任务。MVTec-FS不仅继承了MVTec AD的多样化产品类别和异常特征,还通过实例级标注和多模态分类能力,为少样本学习提供了更精细的基准。其14个子数据集涵盖了多种工业产品类别,适用于1-shot、3-shot和5-shot学习范式,推动了缺陷分类研究的发展。
当前挑战
MVTec-FS数据集在解决缺陷分类问题时面临多重挑战。首先,缺陷类型分类任务本身具有复杂性,尤其是在少样本学习场景下,模型需要从极少量样本中提取有效特征并进行准确分类。其次,数据集的构建过程中,原始图像级标注需通过连通域算法和人工修正转化为实例级标注,这一过程既耗时又容易引入误差。此外,多模态分类任务的引入增加了数据处理的复杂性,要求模型能够同时处理多种数据形式。这些挑战共同构成了MVTec-FS数据集在应用与研究中的核心难点。
常用场景
经典使用场景
MVTec-FS数据集在少样本学习领域具有重要应用,特别是在缺陷分类任务中。该数据集通过对MVTec AD数据集的重新处理,生成了适用于少样本学习的实例级标注,涵盖了14个不同产品类别的异常特征。研究人员可以利用该数据集进行1-shot、3-shot和5-shot学习实验,探索在有限样本下如何有效分类不同类型的缺陷。
解决学术问题
MVTec-FS数据集解决了少样本学习在缺陷分类中的关键问题。传统异常检测任务主要关注缺陷定位,而针对缺陷类型分类的数据集较为稀缺。该数据集通过提供多类别异常实例的精确标注,为少样本学习模型提供了可靠的基准,推动了缺陷分类算法的研究与发展。
实际应用
在实际应用中,MVTec-FS数据集可广泛应用于工业制造领域,特别是在自动化质量检测系统中。通过利用该数据集训练的少样本学习模型,企业能够在生产线上快速识别和分类产品缺陷,提高检测效率并降低人工成本。此外,该数据集还可用于多模态分类任务,进一步提升缺陷检测的准确性。
数据集最近研究
最新研究方向
在工业缺陷检测领域,MVTec-FS数据集的推出为少样本学习研究提供了新的基准。该数据集通过对MVTec AD数据集的精细处理,特别针对缺陷类型分类任务进行了优化,填补了当前异常检测任务中缺陷定位与分类之间的空白。MVTec-FS不仅支持少样本缺陷分类,还可应用于少样本目标检测和多模态统一分类,为工业视觉系统的智能化发展提供了重要支持。其多类别异常标注和实例级注释的引入,使得该数据集在1-shot、3-shot和5-shot学习范式中展现出显著优势,推动了工业缺陷检测技术在复杂场景下的应用与创新。
以上内容由遇见数据集搜集并总结生成



