five

Dual datasets for anomaly detection on metal surface under the influence of impurities

收藏
arXiv2025-01-16 更新2025-01-18 收录
下载链接:
https://fordatis.fraunhofer.de/handle/fordatis/412
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由弗劳恩霍夫工业数学研究所(ITWM)创建,旨在解决金属表面在杂质(如水渍、指纹、贴纸等)影响下的异常检测问题。数据集包含高分辨率图像,模拟了真实工业环境中的表面杂质,并生成了对应的合成数据。数据集通过程序化方法生成,使用Perlin噪声模拟水渍的自然形态,并通过抖动采样方法控制杂质的分布。该数据集主要用于训练和评估异常检测模型,特别是在高分辨率图像处理中的内存瓶颈问题。通过该数据集,研究人员可以更好地理解杂质对模型性能的影响,并优化模型在实际工业场景中的应用。

This dataset was created by the Fraunhofer Institute for Industrial Mathematics (ITWM) to address the anomaly detection problem of metal surfaces affected by impurities such as water stains, fingerprints, stickers, and others. The dataset includes high-resolution images that simulate surface impurities in real industrial environments, alongside corresponding synthetic data. It is generated via a programmatic approach: Perlin noise is used to simulate the natural morphology of water stains, while jittered sampling is employed to control the distribution of impurities. This dataset is primarily used for training and evaluating anomaly detection models, especially to tackle memory bottleneck issues encountered in high-resolution image processing. With this dataset, researchers can better understand the impact of impurities on model performance and optimize the practical industrial application of these models.
提供机构:
弗劳恩霍夫工业数学研究所(ITWM)
创建时间:
2025-01-16
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建采用了基于物理的路径追踪技术,结合了金属表面的纹理模型和自定义参数,生成了高分辨率的合成图像。为了模拟真实环境中的水渍,研究者使用了Perlin噪声和抖动采样技术,生成了具有自然形态的水渍图案。通过调整光照条件和纹理参数,生成了包含水渍和不含水渍的两个版本的数据集,确保了数据集的多样性和真实性。此外,数据集还通过手动标注真实数据中的缺陷和杂质,确保了数据的精确性和可重复性。
使用方法
该数据集主要用于训练和评估异常检测模型,特别是针对金属表面缺陷和水渍等杂质的检测。研究者可以通过合成数据集进行预训练,再使用真实数据集进行微调,以提高模型的泛化能力。数据集的高分辨率图像可以通过Sequential PatchCore方法进行处理,该方法通过分块处理解决了内存瓶颈问题,使得在消费级硬件上进行大规模图像训练成为可能。此外,数据集还可用于研究杂质对模型性能的影响,并通过缺陷召回率等指标评估模型的工业适用性。
背景与挑战
背景概述
Dual datasets for anomaly detection on metal surface under the influence of impurities 是由Fraunhofer ITWM的研究团队于2025年提出的数据集,旨在解决金属表面缺陷检测中的杂质干扰问题。该数据集的创建源于工业制造中自动化视觉检测系统面临的挑战,尤其是表面杂质(如水渍、指纹、贴纸)对检测性能的影响。研究团队通过引入合成数据生成技术,特别是模拟水渍的生成方法,构建了包含真实和合成数据的双数据集。该数据集不仅为表面缺陷检测提供了新的研究视角,还通过Sequential PatchCore方法解决了高分辨率图像训练中的内存瓶颈问题,显著提升了模型在工业环境中的适用性。
当前挑战
该数据集面临的挑战主要集中在两个方面:首先,表面杂质与缺陷在视觉特征上的相似性导致模型难以准确区分,尤其是在水渍与凹陷等缺陷之间,这种相似性显著降低了模型的检测精度。其次,构建过程中,高分辨率图像的处理带来了内存瓶颈问题,传统的PatchCore方法在处理大规模数据时内存消耗过大,难以在消费级硬件上运行。研究团队通过Sequential PatchCore方法,将核心集构建过程序列化,有效缓解了内存压力,但仍需进一步优化以应对更复杂的工业场景。此外,合成数据与真实数据之间的领域差异也对模型的泛化能力提出了挑战。
常用场景
经典使用场景
Dual datasets for anomaly detection on metal surface under the influence of impurities 数据集在金属表面缺陷检测领域具有重要应用,尤其是在存在水渍、指纹等杂质的情况下。该数据集通过生成合成数据,模拟了真实工业环境中的杂质影响,为训练异常检测模型提供了丰富的训练样本。其经典使用场景包括金属板材的表面缺陷检测,特别是在自动化视觉检测系统中,帮助模型区分真实的几何缺陷与表面杂质。
解决学术问题
该数据集解决了自动化视觉检测系统中由于表面杂质(如水渍、指纹等)导致的模型性能下降问题。通过引入合成杂质数据,研究人员能够更好地理解杂质对异常检测模型的影响,并提出了Sequential PatchCore方法,解决了高分辨率图像训练时的内存瓶颈问题。此外,该数据集还通过缺陷级别的召回率(defect-wise recall)提供了对模型性能的工业相关视角,帮助克服标签模糊性问题。
实际应用
在实际应用中,该数据集被广泛用于工业制造中的金属表面质量检测。通过结合合成数据和真实数据,企业能够在生产线上部署更鲁棒的自动化检测系统,减少因杂质干扰导致的误检和漏检。特别是在汽车制造、航空航天等领域,金属板材的表面质量直接影响产品的安全性和性能,该数据集的应用显著提升了检测系统的准确性和效率。
数据集最近研究
最新研究方向
近年来,金属表面异常检测领域的研究逐渐聚焦于合成数据生成与真实数据之间的域适应问题。特别是在表面杂质(如水渍、指纹等)对检测模型性能的影响方面,研究者们提出了多种创新方法。Sequential PatchCore作为一种新型异常检测框架,通过引入顺序核心集构建算法,有效解决了高分辨率图像处理中的内存瓶颈问题。此外,该框架还支持核心集融合技术,能够在不同数据集之间进行知识迁移,显著提升了模型的泛化能力。研究还表明,合成数据中引入表面杂质(如水渍)能够增强模型对真实场景的适应能力,尽管这可能会降低对某些缺陷的检测精度。通过微调技术,模型能够进一步优化其性能,尤其是在缺陷检测的召回率方面表现出色。这一研究方向不仅推动了工业表面检测技术的发展,也为其他领域的异常检测提供了新的思路。
相关研究论文
  • 1
    Sequential PatchCore: Anomaly Detection for Surface Inspection using Synthetic Impurities弗劳恩霍夫工业数学研究所(ITWM) · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作