five

Cosmos-AnomalyGen-PCB-Dataset

收藏
Hugging Face2026-05-30 更新2026-06-01 收录
下载链接:
https://huggingface.co/datasets/nvidia/Cosmos-AnomalyGen-PCB-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Cosmos-AnomalyGen-PCB-Dataset是由NVIDIA Corporation发布的演示数据集,包含86张在富士康工厂拍摄的NV板组件样本图像。该数据集专门用于微调AnomalyGen和Qwen-Image-Edit模型,展示如何生成印刷电路板(PCB)结构缺陷的合成数据。数据集仅用于演示目的,不适用于生产环境。数据格式为PNG和JPG图像文件,总大小为2.01 MB。数据通过人工方式收集,不包含标注信息。该数据集适用于图像到图像任务,特别是在PCB检测、异常生成和合成数据生成等应用场景中作为演示和测试用途。

The Cosmos-AnomalyGen-PCB-Dataset is a demonstration dataset released by NVIDIA Corporation, containing 86 sample images of NV board components captured in a Foxconn factory. This dataset is specifically designed for fine-tuning the AnomalyGen and Qwen-Image-Edit models to demonstrate how to generate synthetic data for structural defects in printed circuit boards (PCBs). It is intended for demonstration purposes only and is not suitable for production environments. The data format includes PNG and JPG image files, with a total size of 2.01 MB. The data was collected manually and does not include annotations. This dataset is applicable for image-to-image tasks, particularly in use cases such as PCB inspection, anomaly generation, and synthetic data generation, serving as a demonstration and testing resource.
提供机构:
NVIDIA
创建时间:
2026-05-25
搜集汇总
数据集介绍
main_image_url
构建方式
Cosmos-AnomalyGen-PCB-Dataset由NVIDIA公司构建,旨在为印刷电路板(PCB)结构缺陷的合成数据生成提供演示样本。该数据集通过人工采集方式获取,共包含86张来自富士康工厂中NVIDIA板卡组件的图像,以PNG和JPG格式存储,总大小为2.01 MB。这些图像专门用于微调AnomalyGen和Qwen-Image-Edit模型,属于演示用途而非生产环境部署。
特点
该数据集虽规模较小,但具有明确的领域专属性与实用导向。其核心价值在于聚焦PCB制造中的质检场景,通过真实工厂环境采集的图像,为结构缺陷的合成数据生成算法提供精细化的调优素材。数据集强调透明性与道德合规性,遵循NVIDIA Sample Data License,并呼吁开发者结合行业需求审慎评估模型适用性,体现了负责任的AI开发理念。
使用方法
使用者需下载数据集后,将其应用于AnomalyGen和Qwen-Image-Edit模型的微调流程。由于数据量仅为86张图像,建议配合其他大规模数据集或数据增强技术使用,以提升模型的泛化能力。鉴于其演示性质,用户应留意许可条款约束,并避免在生产级任务中直接依赖该数据集,同时需对潜在的应用风险进行独立评估与管控。
背景与挑战
背景概述
在电子制造业中,印刷电路板(PCB)的缺陷检测是保障产品质量与可靠性的关键环节。传统的人工目视检测方法效率低下且易出错,而基于深度学习的自动光学检测(AOI)技术则依赖大规模、多样化的缺陷图像数据集进行模型训练。然而,真实工业场景中缺陷样本的稀缺与标注成本的高昂,严重制约了检测模型的泛化能力。由NVIDIA公司于2026年5月发布的Cosmos-AnomalyGen-PCB-Dataset,作为AnomalyGen合成数据生成系统的演示数据集,旨在探索利用合成图像增强PCB结构缺陷检测模型的可行性。该数据集包含86张来自富士康工厂NV主板的组件图像,虽规模较小,却为工业异常生成与图像编辑任务的微调提供了基准样本,彰显了合成数据技术在解决工业检测数据匮乏问题上的潜力。
当前挑战
该数据集所应对的核心挑战在于PCB缺陷检测领域的训练数据稀缺性与场景多样性不足。真实生产线中,裂纹、偏移、焊点不良等结构缺陷发生概率极低,导致标注缺陷样本的获取成本高昂且难以覆盖所有异常类型,进而造成检测模型在处理未知样本时性能骤降。此外,数据集构建过程中也面临诸多难题:采集环境受工厂光照、设备振动及元件遮挡等因素影响,需要人工精确筛选与归一化处理;86张样本量远不足以支撑复杂模型的训练,迫使开发者依赖合成数据生成技术进行数据扩充,而合成图像与真实图像间的域差异(domain gap)可能引入伪影或失真的特征,影响下游任务的迁移效果。
常用场景
经典使用场景
在电子制造与质量检测领域,印刷电路板(PCB)的缺陷检测是确保产品可靠性的关键环节。Cosmos-AnomalyGen-PCB-Dataset 作为由 NVIDIA 发布的小规模样本数据集,其经典使用场景在于为合成数据生成模型(如 AnomalyGen)与图像编辑模型(如 Qwen-Image-Edit)提供微调素材。研究者可利用这 86 张来自富士康工厂的 NV 板组件图像,训练模型学习 PCB 结构缺陷的生成与编辑能力,进而实现合成缺陷样本的自动化生产。该数据集特别适用于验证缺陷生成算法的有效性,为工业视觉中的少样本学习与数据增强技术提供演示基础。
衍生相关工作
该数据集衍生了一系列围绕合成异常生成与工业视觉的创新工作。其中,AnomalyGen 模型成为标杆作品,专门研究如何从极少量真实样本中学习缺陷的潜在分布,并生成高保真度的异常图像。Qwen-Image-Edit 则进一步拓展了交互式缺陷编辑的能力,允许用户通过文字指令精准定位和修改 PCB 图像中的瑕疵区域。这些工作推动了小样本学习、图像编辑与异常检测的交叉融合,启发了后续如 Diffusion-Based Anomaly Synthesis 和 Few-Shot PCB Inspection 等方向的研究。此外,该数据集还催生了针对合成数据质量评估指标(如 FID、LPIPS)在工业场景中的校准分析,丰富了生成模型的评价体系。
数据集最近研究
最新研究方向
该数据集聚焦于印刷电路板(PCB)制造中的智能缺陷检测领域,当前前沿研究方向主要依托合成数据生成技术解决工业异常样本稀缺的痛点。结合NVIDIA Cosmos平台与AnomalyGen方法,研究者正探索将少量真实PCB组件图像转化为多样化、高保真的结构缺陷合成数据,用于微调如Qwen-Image-Edit等视觉编辑模型。这一方向与工业4.0背景下电子制造质量管控的热点事件紧密相连,尤其契合富士康等工厂对自动化光学检测(AOI)升级的迫切需求。通过生成对抗合成策略,不仅能大幅降低人工标注成本,还能覆盖罕见缺陷模式,推动从规则式检测向数据驱动的泛化性检测范式跃迁。该数据集虽为演示用途,但其提供的86张实例为验证合成数据与真实数据间的性能鸿沟提供了基准,对推动工业视觉模型的鲁棒性研究具有示范意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作