IndustrialDigitDataset
收藏IndustrialDigitDatasetGenerator
概述
IndustrialDigitDatasetGenerator 是一个专门用于生成工业场景下数字图像数据集的工具。它能够从系统自带字体中提取数字(0-9),并通过多种数据增强技术生成适用于工业环境的合成数据集,支持YOLO格式的目标检测标注。
关键词
- 工业数字图像
- 工业仪表检测
- 仪表自动化
- 仪表盘读数识别
- 工业仪表读数识别
- 数据增强
- 目标检测
- YOLO标注
- 字体提取
- 游标卡尺自动读数
主要功能
字体提取
- 自动扫描并提取系统中的字体文件
- 过滤不适用的特殊字体
- 自动裁剪和对齐数字图像
数据增强
- 噪声增强
- 高斯噪声
- 椒盐噪声
- 斑点噪声
- 泊松噪声
- 图像变换
- 随机旋转
- 透视变形
- 长宽比调整
- 灰度调整
- 随机遮挡
- 工业背景
- 柏林噪声生成
- 真实工业图像背景(NEU-DET)
- 随机条纹和污点
- 随机图案干扰增强
- 圆形图案(实心/空心)
- 矩形图案(实心/空心)
- 三角形图案(实心/空心)
- 六边形图案(实心/空心)
- 垂直条纹图案
- 水平条纹图案
- 支持自定义图案颜色
- 支持调节图案大小和数量
- 支持调节图案透明度
- 随机位置和旋转角度
- 字母干扰增强
- 从字体文件提取字母
- 进行随机字母干扰或者标注
标注生成
- 自动生成YOLO格式标注,包含边界框和类别信息
安装要求
依赖库
- numpy
- Pillow
- matplotlib
- tqdm
使用方法
0. 下载真实工业背景数据集
使用NEU-DET数据集作为真实工业背景。
1. 字体提取
bash python font_extractor.py
2. 数据集生成
bash python font_png_augmentation.py
3. 可视化验证工具
bash python visualize_annotations.py
bash python test_noise_pattern.py
bash python test_digit_augmentation.py
项目结构
IndustrialDigitDatasetGenerator/ ├── NEU-DET/ │ └── IMAGES/ ├── font_numbers/ │ ├── 0/ │ ├── 1/ │ ├── 2/ │ ├── 3/ │ ├── 4/ │ ├── 5/ │ ├── 6/ │ ├── 7/ │ ├── 8/ │ └── 9/ ├── augmented_dataset/ ├── docs/ │ └── images/ |—— default_config.py ├── font_extractor.py ├── font_png_augmentation.py ├── test_digit_augmentation.py ├── test_noise_pattern.py ├── visualize_annotations.py ├── requirements.txt └── README.md
效果展示
数据增强效果
图案干扰样本示意
YOLO标注可视化




