five

Voxel51/mvtec-ad|工业检测数据集|异常检测数据集

收藏
hugging_face2024-05-06 更新2024-04-19 收录
工业检测
异常检测
下载链接:
https://hf-mirror.com/datasets/Voxel51/mvtec-ad
下载链接
链接失效反馈
资源简介:
MVTec AD是一个用于基准测试工业检测中异常检测方法的数据集。它包含超过5000张高分辨率图像,分为15个不同的对象和纹理类别。每个类别包括一组无缺陷的训练图像和一组包含各种缺陷以及无缺陷图像的测试集。此外,还提供了所有异常的像素级注释。数据集发布在Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0)下,禁止商业用途。

MVTec AD是一个用于基准测试工业检测中异常检测方法的数据集。它包含超过5000张高分辨率图像,分为15个不同的对象和纹理类别。每个类别包括一组无缺陷的训练图像和一组包含各种缺陷以及无缺陷图像的测试集。此外,还提供了所有异常的像素级注释。数据集发布在Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0)下,禁止商业用途。
提供机构:
Voxel51
原始信息汇总

数据集概述

基本信息

  • 名称: MVTec AD
  • 样本数量: 5354
  • 语言: 英文 (en)
  • 许可证: CC-BY-4.0

任务类型

  • 图像分类
  • 图像分割

数据集描述

MVTec AD是一个用于工业检测异常检测方法的基准数据集。它包含超过5000张高分辨率图像,分为十五个不同的对象和纹理类别。每个类别包括一组无缺陷的训练图像和一个测试集,该测试集包含各种类型的缺陷图像以及无缺陷图像。所有异常的像素级精确标注也一并提供。

使用限制

该数据集不可用于商业目的。如果对是否违反非商业使用条款有疑问,请与数据集作者联系。

联系方式

如有任何问题或评论,可通过电子邮件re-request@mvtec.com与数据集作者联系。

引用信息

BibTeX:

bibtex @article{Bergmann2021MVTecAnomalyDetection, title={The MVTec Anomaly Detection Dataset: A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection}, author={Bergmann, Paul and Batzner, Kilian and Fauser, Michael and Sattlegger, David and Steger, Carsten}, journal={International Journal of Computer Vision}, volume={129}, number={4}, pages={1038--1059}, year={2021}, doi={10.1007/s11263-020-01400-4} }

@inproceedings{Bergmann2019MVTecAD, title={MVTec AD — A Comprehensive Real-World Dataset for Unsupervised Anomaly Detection}, author={Bergmann, Paul and Fauser, Michael and Sattlegger, David and Steger, Carsten}, booktitle={IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, pages={9584--9592}, year={2019}, doi={10.1109/CVPR.2019.00982} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
MVTec AD数据集的构建聚焦于工业检测中的异常检测方法基准测试。该数据集包含超过5000张高分辨率图像,分为十五个不同的物体和纹理类别。每个类别包括一组无缺陷的训练图像和一组包含各种缺陷的测试图像,以及无缺陷的图像。所有异常的像素级精确标注也一并提供。数据集的构建过程严格遵循工业检测的标准,确保数据的多样性和代表性,以支持异常检测算法的高效训练和验证。
特点
MVTec AD数据集的主要特点在于其广泛的应用场景和高质量的标注。该数据集不仅涵盖了多种物体和纹理类别,还提供了详细的像素级异常标注,这对于训练和评估异常检测算法至关重要。此外,数据集的图像分辨率高,能够捕捉到细微的缺陷,从而提高了检测的准确性。数据集的发布遵循CC BY-NC-SA 4.0许可协议,确保了非商业用途的合法性。
使用方法
使用MVTec AD数据集时,首先需要安装FiftyOne工具,通过pip命令进行安装。随后,用户可以通过Python脚本加载数据集,并使用FiftyOne的API进行数据集的浏览和分析。加载数据集时,用户可以选择设置'max_samples'等参数以控制加载的样本数量。加载完成后,用户可以启动FiftyOne的应用程序,直观地查看和分析数据集中的图像和标注信息。该数据集适用于图像分类和图像分割任务,特别适合于异常检测算法的开发和测试。
背景与挑战
背景概述
MVTec AD数据集是由MVTec公司主导开发,专注于工业检测领域的异常检测。该数据集于2019年首次发布,由Paul Bergmann等研究人员创建,旨在为无监督异常检测方法提供一个全面的现实世界基准。MVTec AD包含超过5000张高分辨率图像,分为十五个不同的对象和纹理类别,每个类别包含一组无缺陷的训练图像和一组带有各种缺陷的测试图像。该数据集的发布极大地推动了工业检测领域的发展,为研究人员提供了一个标准化的评估平台,促进了异常检测技术的进步。
当前挑战
MVTec AD数据集在构建过程中面临了多个挑战。首先,数据集的多样性和复杂性要求高质量的图像采集和标注,确保每个类别的图像能够准确反映实际工业环境中的各种缺陷。其次,无监督异常检测的本质使得数据集的构建需要特别关注缺陷样本的多样性和代表性,以确保模型能够泛化到未见过的缺陷类型。此外,数据集的使用受到非商业许可的限制,这可能限制了其在商业应用中的广泛采用。最后,数据集的规模和复杂性也对存储和处理提出了较高的要求,需要高效的算法和计算资源来充分利用这些数据。
常用场景
经典使用场景
在工业检测领域,MVTec AD数据集被广泛用于异常检测方法的基准测试。该数据集包含超过5000张高分辨率图像,分为十五个不同的对象和纹理类别。每个类别包括一组无缺陷的训练图像和一组包含各种缺陷的测试图像,以及无缺陷的图像。通过这些数据,研究人员可以开发和评估用于工业检测的异常检测算法,确保其在实际应用中的有效性和可靠性。
实际应用
在实际应用中,MVTec AD数据集被用于开发和优化工业检测系统。例如,在制造业中,通过使用该数据集训练的异常检测模型,可以实时监控生产线上的产品质量,及时发现并处理缺陷产品,从而提高生产效率和产品质量。此外,该数据集还被用于医疗设备检测、食品安全检测等领域,为各行业的自动化检测提供了可靠的技术支持。
衍生相关工作
基于MVTec AD数据集,许多相关的经典工作得以开展。例如,研究人员利用该数据集开发了多种深度学习模型,用于图像分类和分割任务,进一步提升了异常检测的准确性和效率。此外,该数据集还激发了大量关于无监督学习和半监督学习的研究,推动了这些领域的发展。通过这些衍生工作,MVTec AD数据集不仅在工业检测领域产生了深远影响,还在计算机视觉和机器学习领域发挥了重要作用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

新能源光伏功率预测数据

采集数值天气预报数据、实时环境气象数据、光伏电站实时输出功率数据等信息,通过气象预测模型与功率预测算法,实现对光伏电站未来一段时间内气象数据及功率数据的预测。

安徽省数据知识产权登记平台 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录