five

Wood Defect Detection Dataset

收藏
arXiv2025-05-06 更新2025-05-08 收录
下载链接:
https://github.com/covisionlab/diffusion_labeling
下载链接
链接失效反馈
官方服务:
资源简介:
Wood Defect Detection数据集是一个为木材制造工业提供的语义分割和目标检测数据集,包含20276张带有语义分割和边界框标注的图像,涉及10种不同的木材缺陷类别。该数据集用于训练扩散模型和分割模型,以生成高质量的工业数据集样本。该数据集有助于降低工业数据标注成本,提高标注质量,并推动计算机视觉模型在现实世界环境中的可靠性和效率。

The Wood Defect Detection Dataset is a semantic segmentation and object detection dataset developed for the wood manufacturing industry. It contains 20,276 images annotated with both semantic segmentation masks and bounding boxes, encompassing 10 distinct wood defect categories. This dataset is designed for training diffusion models and segmentation models to generate high-quality industrial dataset samples. It helps reduce the cost of industrial data annotation, improve annotation quality, and enhance the reliability and efficiency of computer vision models in real-world industrial scenarios.
提供机构:
Covision Lab Brixen, South Tyrol, Italy
创建时间:
2025-05-06
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Bounding Box-Guided Diffusion for Industrial Image Synthesis
  • 论文标题: Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map
  • 论文链接: https://arxiv.org/abs/2505.03623
  • 会议信息: Synthetic Data for Computer Vision Workshop - CVPR 2025

项目简介

该项目提出了一种基于边界框引导的扩散生成框架,用于合成高质量的工业图像及对应的分割图。该方法支持精确定位、多部件控制和掩模生成,旨在为缺陷检测和分割等下游任务提供数据集支持。

主要特性

  • 基于边界框的条件图像合成
  • 联合生成分割图
  • 支持多对象类型和类别

项目状态

  • 开发状态: 项目正在积极开发中,功能、代码结构和文档可能会发生变化。

引用信息

如果使用此代码,请引用以下论文:

@article{simoni2025syth, title={Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Maps}, author={Simoni, Alessandro and Pelosin, Francesco}, booktitle={Computer Vision and Pattern Recognition Workshops 2025 (CVPR 2025)}, year={2025} }

搜集汇总
数据集介绍
main_image_url
构建方式
Wood Defect Detection Dataset的构建采用了基于扩散模型的创新方法,通过边界框引导的生成技术合成高质量的工业图像和分割标注。研究团队提出了一种双编码策略(BASD和C-BASD),将边界框的空间信息和类别信息转化为连续表示,作为扩散模型的条件输入。该方法首先将离散的分割标注转换为模拟位表示,同时对边界框进行空间距离和类别的双重编码,最终通过条件扩散过程联合生成RGB图像和对应的分割标注。这种半监督方法显著降低了精确标注的成本,同时保证了生成样本的几何一致性和语义准确性。
特点
该数据集的核心特点体现在其工业缺陷检测的专业性和生成样本的高保真度。包含20,107张木材表面图像,涵盖节疤、裂纹、石英等五类典型缺陷,每张图像均配有像素级分割标注和边界框标注。通过定量指标SAE和EBR验证,生成缺陷与标注边界框的空间对齐误差低于5%,远优于现有布局条件生成方法。数据集特别关注工业场景中的小目标缺陷,生成的缺陷样本在形态多样性和纹理真实性方面表现出色,LPIPS指标显示其感知质量优于同类方法。
使用方法
该数据集主要服务于工业缺陷分割模型的训练与评估。使用者可通过提供的边界框标注作为生成条件,利用扩散模型合成任意数量的训练样本。建议采用两阶段使用策略:首先用合成数据预训练分割网络,再使用真实数据进行微调。实验表明,结合合成与真实数据的混合训练可使下游分割任务的F1分数提升1.17%。数据集配套提供预处理代码和评估指标实现,支持直接生成符合特定工业检测需求的定制化数据。对于研究用途,建议重点分析BASD/C-BASD编码对生成质量的影响机制。
背景与挑战
背景概述
Wood Defect Detection Dataset由Covision Lab的研究团队于2025年提出,旨在解决工业视觉检测中木材缺陷分割的数据稀缺问题。该数据集包含20,107张带有边界框和像素级标注的木材表面图像,涵盖节疤、裂纹、石英等五类典型缺陷。作为首个基于扩散模型合成的工业分割数据集,其创新性地采用边界框引导的生成范式,显著降低了高质量标注数据的获取成本。该工作发表于计算机视觉顶会CVPR,为制造业质量检测领域提供了重要的基准数据支持。
当前挑战
该数据集面临的核心挑战体现在两个方面:在领域问题层面,木材缺陷的形态多样性和细微纹理特征对分割模型的定位精度提出了极高要求,传统方法难以平衡小目标检测与复杂背景干扰的矛盾;在构建过程中,研究团队需要解决合成数据与真实工业场景的域差距问题,包括缺陷纹理的真实性、边界框与分割掩模的空间一致性,以及光照条件等物理特性的准确建模。此外,多类别样本不平衡和标注噪声也是数据合成过程中需要克服的关键技术难点。
常用场景
经典使用场景
Wood Defect Detection Dataset在计算机视觉领域,尤其是在工业缺陷检测中,扮演着至关重要的角色。该数据集主要用于训练和评估语义分割模型,特别是在木材制造行业中,用于识别和分类木材表面的各种缺陷,如节疤、裂纹、石英等。通过提供高质量的RGB图像和精确的分割标签,该数据集使得研究人员能够开发出更加准确和鲁棒的缺陷检测算法。
实际应用
在实际应用中,Wood Defect Detection Dataset被广泛应用于木材制造行业的质量控制流程。通过使用该数据集训练的模型,企业能够自动化检测木材表面的缺陷,从而提高生产效率和产品质量。此外,该数据集还可用于其他工业领域的缺陷检测,如金属加工、纺织品检测等,展示了其广泛的适用性和实用价值。
衍生相关工作
该数据集衍生了多项经典工作,特别是在扩散模型和语义分割领域。例如,研究人员基于该数据集提出了边界框引导的扩散方法,显著提高了缺陷生成的空间准确性。此外,该数据集还启发了其他工业缺陷检测数据集的创建,推动了计算机视觉在工业应用中的进一步发展。这些相关工作不仅验证了数据集的实用性,还为未来的研究提供了重要的参考和基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作