Open-Industry
收藏arXiv2026-04-02 更新2026-04-03 收录
下载链接:
https://github.com/hzzzzzhappy/open-industry
下载链接
链接失效反馈官方服务:
资源简介:
Open-Industry是由多所高校联合构建的工业级3D点云异常检测数据集,包含15类常见工业部件共计2400个样本。该数据集采集自真实生产线,每类包含100个正常样本和60个异常样本,涵盖凸起、凹陷、划痕等五种典型缺陷类型,平均异常点比例仅1.2%。通过结构化光采集系统获取多视角点云后,经过校准、配准和降噪处理,最终形成单样本约9万点的标准化数据。该数据集专为开放集监督的3D异常检测任务设计,旨在解决工业质检中真实缺陷样本稀缺条件下的未知异常识别难题。
Open-Industry is an industrial-grade 3D point cloud anomaly detection dataset jointly constructed by multiple universities, comprising a total of 2400 samples across 15 categories of common industrial components. This dataset is collected from real production lines, with each category containing 100 normal samples and 60 abnormal samples, covering five typical defect types such as bumps, dents, scratches and others, with an average proportion of abnormal points being only 1.2%. After acquiring multi-view point clouds via structured light acquisition systems, the dataset undergoes calibration, registration and denoising processing, ultimately forming standardized data with approximately 90,000 points per sample. This dataset is specifically designed for open-set supervised 3D anomaly detection tasks, aiming to address the challenge of unknown anomaly recognition under the condition of scarce real defect samples in industrial quality inspection.
提供机构:
穆罕默德·本·扎耶德人工智能大学; 杭州电子科技大学·计算机学院; 东北大学·软件学院; 深圳奥德修斯金融科技研究院; 深圳大学·计算机与软件工程学院; 深圳大学·人工智能学院; 浙江人工智能研究院
创建时间:
2026-04-02
原始信息汇总
OpenIndustry 数据集概述
数据集基本信息
- 数据集名称:OpenIndustry
- 核心研究领域:开放集监督式三维异常检测
- 主要应用场景:工业场景,专注于检测训练阶段未观察到的未知缺陷
数据集内容与目标
- 旨在支持开放集监督式三维异常检测的研究
- 当前发布阶段提供适用于自监督异常检测任务的数据集划分
- 未来版本将通过官方数据加载器自动生成论文中介绍的开放集设定划分
数据获取与发布状态
- 数据集链接:https://huggingface.co/datasets/HanzheL/open-industry/upload/main
- 当前发布状态:已完成步骤一(OpenIndustry数据集,自监督划分)
- 待发布内容:
- 步骤二:论文中使用的基准实现
- 步骤三:Open3D-AD框架(用于开放集监督式三维异常检测的可泛化框架)
相关论文
- 论文标题:Open-Set Supervised 3D Anomaly Detection: An Industrial Dataset and a Generalisable Framework for Unknown Defects
- arXiv链接:https://arxiv.org/abs/2604.01171
- arXiv ID:2604.01171
- 发表年份:2026
搜集汇总
数据集介绍

构建方式
在三维点云异常检测领域,高质量真实工业数据集的构建对于推动算法在复杂生产环境中的泛化能力至关重要。Open-Industry数据集通过构建一套包含两台CCD相机、结构光投影仪及360度自动转台的结构化采集系统,直接从真实工业产线采集数据。其构建流程涵盖了系统标定、多视角配准、去噪、重采样以及精细化的缺陷标注,确保了点云数据的几何精度与标注可靠性。该数据集包含15类常见工业零部件,每类提供100个正常样本与60个异常样本,异常类型涵盖凸起、凹陷、划痕、疤痕及变形五种典型工艺缺陷,平均异常点比例仅为1.20%,高度还原了工业质检中缺陷极度稀疏的真实场景。
特点
Open-Industry数据集的核心特点在于其高度的真实性与任务设定的前瞻性。与依赖合成数据或玩具物体的现有基准不同,该数据集全部源自实际加工环境,保留了真实的制造痕迹、表面纹理与工艺诱导缺陷,从而为算法提供了逼近实战的测试平台。其数据组织遵循开放集监督范式,明确区分为正常样本、可见异常与不可见异常三类,旨在模拟工业检测中模型仅能接触部分已知缺陷类型、却需检测未知缺陷的挑战性场景。此外,数据集中缺陷的形态往往较为细微,如划痕与疤痕仅占据高度局部化区域,而凸起、凹陷等缺陷可能与正常功能结构重叠,导致边界模糊与几何对比度弱,进一步提升了检测难度。
使用方法
为系统评估开放集监督三维异常检测方法的性能,Open-Industry数据集设定了严谨的使用框架。研究通常在此框架下训练模型,即仅使用大量正常样本及少量来自部分类别的已知异常样本进行训练,而后在测试阶段评估模型对未见异常类别的检测与定位能力。为公平比较并分析监督强度的影响,数据集支持构建不同已知异常样本数量的训练设置。基于此,研究者可建立综合基准,不仅评估通用开放集异常检测方法向点云数据的迁移效果,也能检验标准三维异常检测方法在真实产线条件下的表现。该数据集已成为推动开放集监督三维异常检测这一新兴任务发展的关键资源。
背景与挑战
背景概述
三维点云异常检测作为工业质检领域的关键技术,近年来备受关注。然而,现有研究多集中于无监督或依赖合成异常样本的范式,难以应对实际产线中真实缺陷样本稀缺且类型未知的复杂场景。为填补这一空白,由杭州电子科技大学、东北大学及深圳大学等机构的研究团队于2026年共同构建了Open-Industry数据集。该数据集聚焦于开放集监督三维异常检测这一新兴任务,旨在利用少量已知异常样本训练模型,使其能够泛化至未见过的缺陷类别。数据集包含15类真实工业零件,涵盖垫圈、螺钉、螺母等常见组件,并采集了凸起、凹陷、划痕、疤痕及变形五种真实缺陷类型,共计2400个高质量点云样本。其构建严格遵循ISO-9001-2025认证标准,模拟了真实工业检测环境,为评估模型在开放集设定下的泛化能力提供了重要基准。
当前挑战
Open-Industry数据集致力于解决开放集监督三维点云异常检测的核心挑战。在领域问题层面,模型需在训练阶段仅利用正常样本和有限已知异常样本的情况下,精准识别测试时出现的未知缺陷类别,这要求算法具备强大的分布外泛化能力,以应对真实工业场景中缺陷形态的多样性与不可预见性。在构建过程中,挑战主要源于数据采集与处理的复杂性:首先,从真实产线采集高精度点云需克服设备校准、多视角配准及噪声滤除等技术难题;其次,缺陷在点云中占比极低,平均异常点比率仅为1.20%,且形态细微、边界模糊,为精确标注带来巨大困难;此外,需系统设计训练集与测试集的划分策略,确保已知与未知异常类别间的分布差异,以真实反映开放集检测的严峻性。
常用场景
经典使用场景
在三维工业质检领域,Open-Industry数据集为开放集监督异常检测提供了标准化的评估基准。该数据集包含从真实生产线采集的15类工业部件点云,每类均涵盖正常样本及五种实际缺陷类型,如凸起、凹陷、划痕等。其经典使用场景在于模拟实际制造环境中仅能获取少量已知异常样本的检测条件,通过划分可见异常与不可见异常类别,系统评估模型在训练阶段利用有限异常监督、在测试阶段泛化至未知缺陷类型的能力。该场景精准对应了工业质检中缺陷类型多样且难以预先穷举的现实挑战。
解决学术问题
Open-Industry数据集主要解决了三维点云异常检测中监督信号弱与泛化能力不足的核心学术问题。传统方法多依赖无监督或合成异常,缺乏对真实异常分布的有效建模,导致模型对未知缺陷的识别能力有限。该数据集通过提供少量真实异常样本作为监督信号,支持开放集监督学习范式的建立,使模型能够同时学习正常与异常特征流形。其意义在于推动了三维异常检测从封闭集向开放集范式的转变,为利用有限标注实现强泛化能力提供了可靠的数据基础与研究平台,显著提升了该领域对现实复杂性的建模深度。
衍生相关工作
围绕Open-Industry数据集,研究者衍生出一系列经典工作,主要集中在开放集监督三维异常检测方法的创新与基准拓展。其提出的Open3D-AD框架首次将对应分布子采样策略引入点云异常检测,通过解耦正常与异常特征分布以提升泛化性能。该数据集亦催生了针对工业点云的多种基准方法适配研究,如将DevNet、DRA等开放集检测方法迁移至点云模态的探索。此外,相关工作进一步推动了多模态工业异常检测、零样本三维异常识别等方向的发展,并与Real3D-AD、Anomaly-ShapeNet等数据集共同构成了更为完善的三维异常检测评估体系。
以上内容由遇见数据集搜集并总结生成



