five

MVTec 3D-AD Dataset|3D异常检测数据集|工业检测数据集

收藏
arXiv2021-12-17 更新2024-06-21 收录
3D异常检测
工业检测
下载链接:
https://www.mvtec.com/company/research/datasets
下载链接
链接失效反馈
资源简介:
MVTec 3D-AD数据集是由MVTec Software GmbH创建的,专注于无监督3D异常检测和定位的综合性数据集。该数据集包含4147个高分辨率的3D点云扫描,涵盖10个真实世界对象类别。训练和验证集仅包含无异常样本,而测试集则包含多种类型的异常,如划痕、凹陷、孔洞、污染或变形,并提供精确的地面实况标注。数据集的创建旨在模拟工业检测场景,解决实际中可能出现的未知缺陷类型检测问题,适用于深度学习方法的训练和评估。
提供机构:
MVTec Software GmbH
创建时间:
2021-12-17
AI搜集汇总
数据集介绍
main_image_url
构建方式
MVTec 3D-AD数据集的构建方式独具匠心,旨在填补3D计算机视觉领域中无监督异常检测和定位数据集的空白。该数据集的构建灵感来源于现实世界的视觉检测场景,其中模型需要在仅使用无异常数据训练的情况下检测制造产品上的各种缺陷。数据集包含了使用高分辨率工业3D传感器采集的10个不同物体类别的深度扫描。对于所有物体类别,均提供了仅包含无异常样本的训练集和验证集。相应的测试集包含显示各种缺陷(如划痕、凹痕、孔洞、污染或变形)的样本。每个异常测试样本都提供了精确的地面真实标注。初步的3D异常检测方法基准测试表明,现有方法在数据集上的表现仍有很大提升空间。
特点
MVTec 3D-AD数据集的特点在于其真实性和多样性。数据集由4147个高分辨率3D点云扫描组成,涵盖了10个现实世界物体类别。训练和验证集仅包含无异常数据,而测试集则包含各种类型的异常。每个异常测试样本都提供了精确的地面真实标注,这对于算法评估和改进至关重要。此外,数据集还包含了大量的自然变异和可变形物体,这使得数据集更具挑战性和实用性。
使用方法
MVTec 3D-AD数据集的使用方法较为简单。用户可以根据需要选择训练集、验证集或测试集进行模型训练、验证或测试。数据集提供了精确的地面真实标注,可以使用各种性能评估指标来评估模型的异常检测和定位能力。此外,数据集还支持数据增强,可以使用各种技术(如裁剪、平移或旋转)来增加训练集的大小,从而提高模型的泛化能力。
背景与挑战
背景概述
随着现代3D传感器在可用性和精确度方面的不断提升,3D计算机视觉领域取得了显著进展。研究人员利用这些设备创建了各种数据集,以解决现实世界中的问题,如点云配准、分类、3D语义分割、3D目标检测和刚体姿态估计。在这些应用中,一个特别重要的任务是识别模型在训练过程中未观察到的异常数据。在制造业中,例如,这些方法可以用于检测推理过程中的缺陷,而模型只在无异常样本上进行训练。在自动驾驶中,智能系统能够检测到在训练中未看到的结构至关重要。然而,在3D领域中,无监督异常检测领域的研究相对较少。主要原因是缺乏合适的3D数据集。为了填补这一空白并激发对开发新方法的研究兴趣,我们引入了一个用于无监督3D异常检测和定位的现实世界数据集。该数据集由10个不同对象类别的4147个高分辨率3D点云扫描组成。训练和验证集仅包含无异常样本,而测试集包含各种类型的异常。对于每个异常测试样本,我们提供了精确的地面真实标注。初步基准测试表明,现有方法在我们的数据集上表现不佳,未来仍有很大的改进空间。
当前挑战
MVTec 3D-AD数据集面临的挑战主要包括:1)在无监督3D异常检测和定位任务中,缺乏足够的训练数据和精确的标注;2)现有的3D异常检测方法在处理各种类型的缺陷(如划痕、凹陷、孔洞、污染或变形)时,性能有待提高;3)如何有效地利用颜色信息和其他多模态数据来提高异常检测和定位的准确性;4)如何减少异常检测方法中的误报率,使其在实际工业应用中更具实用性。
常用场景
经典使用场景
MVTec 3D-AD Dataset是一个专门用于无监督3D异常检测和定位的数据集。它模拟了现实世界中的视觉检测场景,其中模型需要检测制造产品上的各种缺陷,即使它只在无异常数据上进行训练。该数据集包含来自10个不同物体类别的4147个高分辨率3D点云扫描。对于所有物体类别,我们提供了一个仅包含无异常样本的培训和验证集。相应的测试集包含显示各种缺陷的样本,如划痕、凹痕、孔、污染或变形。对于每个异常测试样本,都提供了精确的地面真实标注。一个初始的3D异常检测方法基准表明,在性能方面还有很大的提升空间。
解决学术问题
MVTec 3D-AD Dataset解决了无监督3D异常检测和定位中缺乏合适数据集的问题。现有的方法主要针对2D图像数据,而3D领域相对较少探索。该数据集为研究人员提供了一个用于开发和测试无监督3D异常检测方法的平台,并促进了相关算法的研究和改进。
衍生相关工作
MVTec 3D-AD Dataset的推出引发了相关领域的研究热潮。研究人员利用该数据集开发了各种无监督3D异常检测方法,如Voxel f-AnoGAN和Voxel AE。这些方法在定位和检测异常方面取得了显著进展,为实际应用提供了有力的支持。未来,随着更多相关研究的开展,MVTec 3D-AD Dataset有望在3D计算机视觉领域发挥更大的作用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Global Solar Dataset

在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。

github 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

ECMWF Reanalysis v5 (ERA5)

ERA5 是第五代 ECMWF 全球气候大气再分析,涵盖从 1940 年 1 月至今的时期。ERA5 由 ECMWF 的哥白尼气候变化服务 (C3S) 制作。 ERA5 提供大量大气、陆地和海洋气候变量的每小时估计值。这些数据以 30 公里的网格覆盖地球,并使用从地表到 80 公里高度的 137 个级别解析大气。ERA5 包括有关所有变量在降低空间和时间分辨率下的不确定性的信息。

OpenDataLab 收录