Spark-AnomalyGen-USD
收藏Hugging Face2026-05-30 更新2026-06-01 收录
下载链接:
https://huggingface.co/datasets/nvidia/Spark-AnomalyGen-USD
下载链接
链接失效反馈官方服务:
资源简介:
Spark-AnomalyGen-USD数据集是由NVIDIA Corporation创建的一个合成数据集,主要用于演示生成印刷电路板(PCB)结构缺陷的合成数据。该数据集包含完整的PCBA场景USD文件(spark_lighting.usd),以及一个已制作的AOI环形灯装置(aoi_ring_light.usda)和相机,这些资源已准备好用于合成数据生成渲染。USD文件源自底层CAD设计。数据集格式包括OpenUSD文件、MDL文件以及PNG/JPG纹理,总大小为253 MB。数据规模小于1K。标签方法采用混合方式,结合了人工和合成标注。该数据集旨在作为软件演示的输入示例,用于生成PCB结构缺陷的合成数据,适用于PCB检测、合成数据生成和3D场景渲染等应用场景。数据集遵循NVIDIA示例数据许可证,仅限演示用途,不可用于生产环境。
The Spark-AnomalyGen-USD dataset is a synthetic dataset created by NVIDIA Corporation, primarily used to demonstrate the generation of synthetic data for structural defects in printed circuit boards (PCBs). It includes complete PCBA scene USD files (spark_lighting.usd), along with a pre-made AOI ring light setup (aoi_ring_light.usda) and camera, all ready for synthetic data generation rendering. The USD files are derived from underlying CAD designs. The dataset format consists of OpenUSD files, MDL files, and PNG/JPG textures, with a total size of 253 MB. The data scale is less than 1K. The labeling method is hybrid, combining manual and synthetic annotations. This dataset is intended as an input example for software demonstrations to generate synthetic data for PCB structural defects, applicable in scenarios such as PCB inspection, synthetic data generation, and 3D scene rendering. It follows the NVIDIA sample data license, restricted to demonstration purposes and not for production use.
提供机构:
NVIDIA
创建时间:
2026-05-25
搜集汇总
数据集介绍

构建方式
Spark-AnomalyGen-USD数据集由NVIDIA精心构建,基于底层CAD设计转化为完整的OpenUSD场景。数据集包含一个名为'spark_lighting.usd'的全流程PCBA场景,并搭配了专为自动光学检测(AOI)设计的环形光源模型('aoi_ring_light.usda')及摄像机,形成一套即插即用的合成数据生成渲染管线。数据采集完全采用合成方式,标注则通过人工与合成相结合的混合策略完成。
特点
该数据集以结构化缺陷检测为核心,聚焦于印刷电路板(PCB)领域的合成数据生成。其显著特点在于提供了高度可定制的USD格式资产,包括丰富的纹理文件(PNG/JPG)和MDL材质描述,使得用户能够灵活调整光照、视角等参数,模拟真实AOI检测环境。数据集体积仅为253 MB,轻量且高效,专为演示和验证合成数据生成软件在工业质检中的潜力而设计。
使用方法
用户可将Spark-AnomalyGen-USD作为输入场景,在支持OpenUSD的渲染引擎中加载,利用内置的AOI环形光源和摄像机设置直接生成带缺陷的合成图像。数据集遵循NVIDIA示例数据许可协议,仅供演示用途。建议开发者根据自身行业需求调整场景配置,并通过NVIDIA提交安全漏洞或AI相关反馈以确保合规使用。
背景与挑战
背景概述
Spark-AnomalyGen-USD数据集由NVIDIA公司于2026年5月30日创建,旨在为印刷电路板(PCB)自动光学检测(AOI)领域提供合成数据生成的基础支撑。该数据集以OpenUSD格式封装了完整的PCBA场景、AOI环形光源及相机配置,来源于真实CAD设计,专为演示结构性缺陷的合成数据生成而设计。作为NVIDIA在工业检测与3D合成数据领域的代表性成果,它融合了物理精确的3D资产与灵活的渲染管线,为智能制造中的缺陷检测算法训练提供了标准化的虚拟测试平台,并推动了以数字孪生驱动的工业视觉解决方案发展。
当前挑战
该数据集所解决的领域挑战在于,真实PCB缺陷检测数据获取成本高昂、标注困难且样本分布不均,而Spark-AnomalyGen-USD通过合成数据生成技术,在虚拟环境中模拟AOI检测流程,提供了可扩展、可定制的缺陷样本来源。构建过程中的挑战包括:从CAD模型到符合物理渲染规范的USD资产转换,需兼顾几何精度与材质真实感;设计可复用的AOI光源与相机配置,确保合成数据与真实检测场景的光学特性一致;以及在小规模数据集(不足1K样本)下,验证合成数据对下游缺陷检测模型性能的有效泛化能力。
常用场景
经典使用场景
Spark-AnomalyGen-USD数据集是工业自动化视觉检测领域的一项重要资源,专为印刷电路板(PCB)的合成数据生成而设计。该数据集以OpenUSD格式封装了完整的PCBA三维场景,包括组件模型、AOI环形光源装置及相机配置,可直接用于渲染生成高保真的合成图像。其最经典的使用场景是作为结构缺陷生成管线的输入,通过软件工具在三维场景中自动注入不同类型的物理缺陷(如焊接不良、元器件偏移或缺失),从而生成带有精确标注的缺陷样本。这种基于物理建模的合成数据生成方式,有效解决了真实工业场景中缺陷样本稀缺、标注成本高昂的核心难题。
实际应用
在实际工业应用中,Spark-AnomalyGen-USD数据集主要用于自动化光学检测(AOI)系统的研发与验证。基于该数据集生成的合成缺陷图像可直接用于训练诸如YOLO、Faster R-CNN等目标检测模型,实现对PCB焊接缺陷(如桥接、虚焊、空洞)及元器件异常的高效识别。此外,该数据集所提供的标准化USD场景也为多视角渲染和光照条件模拟提供了便利,使得检测系统能够适应不同产线的光照环境和检测角度,大幅减少现场调试与数据采集的时间成本。电子制造企业可借助该数据集快速构建原型系统,在量产前验证算法的检出率与误报率,从而加速产品落地周期。
衍生相关工作
Spark-AnomalyGen-USD数据集的发布催生了多项具有影响力的衍生研究。基于其统一的三维资产格式,研究者开发了诸如AnomalyGen Pipeline等开源工具,实现了从缺陷注入到渲染标注的全流程自动化,降低了合成数据生成的技术门槛。同时,该数据集也为域自适应方法提供了理想的实验平台,相关工作如CycleGAN域迁移、风格迁移对抗训练等在PCB缺陷检测领域得到深入探讨。此外,利用该数据集的物理精确性,研究者进一步探索了基于数字孪生的增量学习策略,使模型在生产环境变化(如元器件批次更替)时能快速适应,这些衍生工作共同推动了工业视觉检测从数据驱动迈向物理驱动的高效融合方向。
以上内容由遇见数据集搜集并总结生成



