five

HSS-IAD

收藏
arXiv2025-04-17 更新2025-04-19 收录
下载链接:
https://github.com/Qiqigeww/HSS-IAD-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
HSS-IAD数据集是由复旦大学工程学院和计算机科学技术学院共同构建的,包含8590张金属类工业零件图像和精确的异常标注。这些零件在结构或外观上存在差异,但属于同一类产品,且缺陷细微,与基材相似,易于与加工痕迹、油污等混淆。数据集旨在为多类工业异常检测算法提供更具挑战性的基准,以促进算法在现实工厂条件下的性能提升。

The HSS-IAD dataset was jointly constructed by the School of Engineering and the School of Computer Science and Technology of Fudan University. It comprises 8,590 images of metal industrial components along with precise anomaly annotations. These parts belong to the same product category but differ in structure and appearance, with subtle defects that are highly similar to the base material and easily misidentified as processing marks, oil stains and other similar surface artifacts. This dataset aims to provide a more challenging benchmark for multi-class industrial anomaly detection algorithms, so as to promote the performance improvement of such algorithms under real-world factory conditions.
提供机构:
复旦大学工程学院,复旦大学计算机科学技术学院
创建时间:
2025-04-17
搜集汇总
数据集介绍
main_image_url
构建方式
HSS-IAD数据集的构建过程体现了对工业场景真实需求的深度考量。研究团队从KolektorSDD2、Casting、MTD等多个现有数据集中精选样本,经过严格的图像质量评估,剔除了模糊、重复及低质量图像。针对数据增强方法的有效性,团队采用DIS技术生成了目标前景图像,为合成异常样本的生成奠定了基础。对于缺乏精确标注的数据源,如STEEL数据集,研究团队通过文本描述信息重建了像素级掩模,并进行了人工标注校验与修正,确保了异常区域的精确标注。数据集最终包含7个类别共8,580张金属类工业部件图像,涵盖了结构或外观存在差异的同类型工业产品。
特点
HSS-IAD数据集在工业异常检测领域具有显著特色。其核心价值在于模拟真实工厂环境,所有子类别均为同类型金属工业产品,但在结构或外观上呈现明显差异,这与工厂实际生产场景高度吻合。数据集的异常样本具有挑战性特征:缺陷与基材相似度高(异常像素占比仅3.0%),且包含易与加工痕迹、油渍等干扰源混淆的细微缺陷,如细微划痕、冷裂纹等。这种高相似性设置大幅提升了检测难度,使得该数据集成为评估算法在复杂工业环境下鲁棒性的理想基准。
使用方法
HSS-IAD数据集支持两种典型的工业异常检测评估范式。在类分离设置下,研究者可为每个产品类别单独训练检测模型,适用于专业化工业检测场景。而在多类统一检测设置中,所有类别数据共同训练单一模型,更符合实际工厂中多品类并行检测的需求。数据集提供像素级精确标注的测试样本,支持图像级异常分类(I-AUROC)和像素级异常定位(P-AUPRO)双指标评估。为促进合成异常生成,数据集额外提供了经过DIS处理的前景图像,便于数据增强类方法的开发与验证。
背景与挑战
背景概述
HSS-IAD数据集由复旦大学工程与技术研究院和计算机科学学院的研究团队于2025年推出,旨在解决工业异常检测(IAD)领域中的多类无监督异常检测(MUAD)问题。该数据集包含8,580张金属类工业零件图像,涵盖7个类别,具有结构或外观上的多样性,并提供了精确的异常标注。HSS-IAD的创建填补了现有数据集(如MVTecAD、Real-IAD等)在真实工业场景中的不足,特别是在同一工厂生产同类但结构多样的产品检测需求上。该数据集通过模拟真实的工业缺陷(如细微划痕、冷裂纹等)和干扰源(如氧化皮、加工痕迹等),为工业异常检测算法的研究和评估提供了更贴近实际的基准。
当前挑战
HSS-IAD数据集面临的挑战主要体现在两个方面:一是领域问题的挑战,即如何在高相似度的工业零件中检测出细微且易混淆的异常,这些异常往往与材料本身或加工痕迹高度相似,增加了检测的难度;二是构建过程中的挑战,包括如何从现有数据集中筛选和重新分类高质量的图像,以及如何生成逼真的合成异常以增强数据集的多样性。此外,数据集中异常区域的标注也面临挑战,如处理标注错误或微小检测区域的问题。这些挑战使得HSS-IAD成为一个高难度的基准数据集,能够有效推动工业异常检测算法的进步和创新。
常用场景
经典使用场景
HSS-IAD数据集在工业异常检测领域中被广泛应用于多类无监督异常检测算法的评估与优化。其独特的异构同类别工业产品设计,使得该数据集能够模拟真实工厂环境中同一生产线上的多样化产品结构及外观变化。研究者通过该数据集可深入探究算法在复杂工业场景下的泛化能力,尤其是在处理与基材高度相似的细微缺陷(如划痕、冷裂纹、微小斑点等)时的表现。
解决学术问题
该数据集有效解决了现有工业异常检测数据集中类别不相关、缺陷仿真度低等核心问题。通过提供7类金属类工业部件的8580张图像及精确标注,HSS-IAD填补了学术界对同类别多结构产品缺陷检测的研究空白。其高相似度背景干扰(如氧化皮、加工痕迹)与3%异常像素占比的特性,为突破小缺陷检测、类内分布建模等关键技术瓶颈提供了标准化测试平台。
衍生相关工作
基于HSS-IAD的基准测试已催生多项创新方法,如采用DINOv2特征表达的Dinomaly框架、基于去噪师生架构的DeSTSeg等。这些工作通过引入特征空间扰动策略、多层次异常映射机制,显著提升了算法在复杂工业场景中的鲁棒性。数据集还推动了跨模态检测、语义理解与大模型微调等衍生研究方向的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作