isdd-dataset-voc

github2026-04-06 更新2026-04-17 收录

下载链接：

https://github.com/TimStarling/ISDD-Lite

下载链接

链接失效反馈

官方服务：

资源简介：

项目使用VOC格式数据集，路径为`dataset/isdd-dataset-voc`。数据集结构包括原始图像、VOC XML标注文件、类别列表、数据划分文件等。当前数据划分规模为训练集205张、验证集23张、测试集13张。

This project utilizes a VOC-formatted dataset stored at the path `dataset/isdd-dataset-voc`. The dataset structure includes raw images, VOC XML annotation files, category lists, data split files, and other relevant components. The current data split scale consists of 205 training images, 23 validation images, and 13 test images.

创建时间：

2026-04-06

原始信息汇总

ISDD-Lite 数据集概述

数据集基本信息

数据集名称：ISDD-Lite
项目性质：基于 PaddleDetection 的轻量化工业缺陷检测项目
核心模型：SSD-MobileNetV1 + QAT（量化感知训练）模型
适用场景：边缘设备、嵌入式平台和资源受限环境部署；铝片表面缺陷识别、工业视觉质检、自动化巡检；机器人与人工智能大赛、集成电路创新创业大赛海云捷讯/皓耀赛道的基础算法项目

数据集内容与结构

数据集格式

格式：VOC 格式数据集
路径：dataset/isdd-dataset-voc/

数据集文件结构

dataset/isdd-dataset-voc/ ├─ images/：原始图像 ├─ annotations/：VOC XML 标注文件 ├─ label_list.txt：类别列表 ├─ train.txt：训练集划分文件 ├─ val.txt：验证集划分文件 ├─ test.txt：测试集划分文件 └─ trainval.txt：训练集合并文件

数据规模

训练集：205 张图像
验证集：23 张图像
测试集：13 张图像

模型与检测类别

检测类别

支持以下 5 个工业缺陷类别：

ca_shang
zang_wu
zhe_zhou
zhen_kong
zheng_chang

模型技术规格

检测架构：SSD
骨干网络：MobileNetV1
训练方式：QAT 量化感知训练
输入尺寸：300 x 300
评估指标：VOC

项目核心文件

已保留内容

ppdet/：PaddleDetection 运行核心代码
tools/：训练、评估、推理、导出入口
configs/：当前模型所需配置
dataset/isdd-dataset-voc/：当前数据集
output/ssd_mobilenet_v1_qat/：最佳训练权重
output_inference/ssd_mobilenet_v1_qat/：导出的推理模型
ssd_mobilenet_v1_opt.nb：Paddle Lite 优化模型

配置文件说明

基础检测配置：configs/ssd/ssd_mobilenet_v1_300_120e_voc.yml
量化训练配置：configs/slim/quant/ssd_mobilenet_v1_qat.yml
数据集配置：configs/datasets/voc.yml

使用说明摘要

环境要求

Python 环境需自行配置
需安装 PaddlePaddle（CPU 或 GPU 版本）
建议使用虚拟环境

关键操作命令

训练命令：使用 tools/train.py 并指定基础检测配置和量化训练配置
评估命令：使用 tools/eval.py 并指定权重文件
导出推理模型：使用 tools/export_model.py
单张图片推理：使用 tools/infer.py 并指定输入图像

自定义调整

修改类别：需同步修改 label_list.txt 和 configs/datasets/voc.yml
替换数据集：保持 VOC 目录格式，修改数据集配置中的路径和参数
调整训练策略：修改基础检测配置和优化器配置
调整量化参数：修改量化训练配置文件中的相关参数

搜集汇总

数据集介绍

构建方式

在工业视觉质检领域，数据集的构建需兼顾真实场景的多样性与标注的精确性。isdd-dataset-voc采用VOC格式进行组织，其构建过程首先收集铝片表面缺陷图像，涵盖擦伤、脏污、折皱、针孔及正常状态五种类别。每张图像均配有XML格式的标注文件，详细记录了缺陷边界框与类别信息。数据集通过预定义的文件列表划分为训练集、验证集与测试集，规模分别为205张、23张与13张，确保了模型训练与评估的数据基础。

使用方法

使用该数据集时，需依托PaddleDetection框架进行模型开发。用户首先配置Python与PaddlePaddle环境，通过修改配置文件中的数据集路径与类别数以适配数据。训练阶段可结合基础检测配置与量化训练配置启动模型学习，利用提供的权重文件进行迁移学习或完整训练。评估与推理环节支持单张图像测试与批量处理，导出功能可将模型转换为轻量化格式，便于在嵌入式平台部署。数据集还允许通过调整标注文件与配置参数，灵活适应新的缺陷类别或不同工业场景。

背景与挑战

背景概述

工业缺陷检测作为智能制造与质量控制的核心环节，其自动化水平直接关乎生产效率和产品质量。在此背景下，isdd-dataset-voc数据集应运而生，它隶属于ISDD-Lite项目，由PaddleDetection社区支持构建，旨在为铝片表面缺陷识别等工业视觉质检任务提供标准化的视觉数据基准。该数据集采用PASCAL VOC格式进行组织，涵盖了擦伤、脏污、折皱、针孔及正常状态五类典型缺陷，其创建紧密围绕轻量化检测模型在边缘设备上的部署需求，通过量化感知训练技术优化模型体积与推理速度，为资源受限环境下的实时缺陷检测提供了重要的数据支撑与研究范式。

当前挑战

在工业缺陷检测领域，核心挑战在于缺陷形态的多样性与细微性，以及复杂背景下的精准定位与分类。isdd-dataset-voc所针对的铝片表面缺陷往往呈现低对比度、微小尺寸及不规则形状，这对模型的特征提取与判别能力提出了严峻考验。数据集构建过程中，挑战同样显著：数据规模相对有限，训练集仅205张图像，可能影响模型的泛化性能；标注过程需高度精确，细微缺陷的边界界定与类别区分依赖专业经验，易引入标注噪声；此外，为适配边缘计算，需在有限数据上实现模型轻量化与量化，平衡检测精度与计算效率，这一过程本身即构成一项复杂的技术挑战。

常用场景

经典使用场景

在工业视觉质检领域，isdd-dataset-voc数据集以其轻量化与高效性，成为边缘计算环境下缺陷检测模型训练与验证的经典范例。该数据集聚焦铝片表面缺陷识别，涵盖擦伤、脏污、折皱、针孔及正常状态五类标注，通过VOC格式的结构化标注，为SSD-MobileNetV1等轻量级检测架构提供了标准化的训练与评估基准。其经典使用场景在于支撑量化感知训练流程，使模型在资源受限的嵌入式平台中实现高精度实时缺陷定位，为工业自动化巡检提供了可靠的数据基础。

解决学术问题

isdd-dataset-voc数据集针对工业缺陷检测中样本稀缺、标注成本高昂以及边缘部署场景下的模型效率瓶颈，提供了系统性的解决方案。该数据集通过规范的VOC标注格式与多类别缺陷样本，有效缓解了小样本学习中的过拟合问题，并为轻量化检测网络的性能评估建立了统一指标。其意义在于推动了工业视觉领域在模型压缩与量化感知训练方面的研究进展，促进了学术探索与实际应用需求的深度融合，为资源受限环境下的高精度实时检测算法提供了可复现的基准平台。

实际应用

在实际工业场景中，isdd-dataset-voc数据集直接服务于铝材制造、电子元件生产等领域的表面质量检测系统。基于该数据集训练的轻量化模型可部署于嵌入式设备或移动机器人，实现产线实时自动化巡检，显著降低人工质检成本并提升缺陷识别的一致性。其应用延伸至机器人与人工智能竞赛、集成电路创新赛事等实践平台，为技术验证与算法优化提供了贴近工业真实需求的数据支撑，推动了智能质检技术在制造业的落地与普及。

数据集最近研究