five

IndustrialDigitDataset

收藏
github2024-11-08 更新2024-11-12 收录
下载链接:
https://github.com/kanhao100/IndustrialDigitDatasetGenerator
下载链接
链接失效反馈
官方服务:
资源简介:
IndustrialDigitDataset 是一个专门用于生成工业场景下数字图像数据集的工具。它能够从系统自带字体中提取数字(0-9),并通过多种数据增强技术生成适用于工业环境的合成数据集,支持YOLO格式的目标检测标注。

IndustrialDigitDataset is a specialized tool for generating digital image datasets for industrial scenarios. It extracts digits (0-9) from system-native fonts, generates synthetic datasets tailored for industrial environments through multiple data augmentation techniques, and supports object detection annotations in YOLO format.
创建时间:
2024-11-01
原始信息汇总

IndustrialDigitDatasetGenerator

概述

IndustrialDigitDatasetGenerator 是一个专门用于生成工业场景下数字图像数据集的工具。它能够从系统自带字体中提取数字(0-9),并通过多种数据增强技术生成适用于工业环境的合成数据集,支持YOLO格式的目标检测标注。

关键词

  • 工业数字图像
  • 工业仪表检测
  • 仪表自动化
  • 仪表盘读数识别
  • 工业仪表读数识别
  • 数据增强
  • 目标检测
  • YOLO标注
  • 字体提取
  • 游标卡尺自动读数

主要功能

字体提取

  • 自动扫描并提取系统中的字体文件
  • 过滤不适用的特殊字体
  • 自动裁剪和对齐数字图像

数据增强

  • 噪声增强
    • 高斯噪声
    • 椒盐噪声
    • 斑点噪声
    • 泊松噪声
  • 图像变换
    • 随机旋转
    • 透视变形
    • 长宽比调整
    • 灰度调整
    • 随机遮挡
  • 工业背景
    • 柏林噪声生成
    • 真实工业图像背景(NEU-DET)
    • 随机条纹和污点
  • 随机图案干扰增强
    • 圆形图案(实心/空心)
    • 矩形图案(实心/空心)
    • 三角形图案(实心/空心)
    • 六边形图案(实心/空心)
    • 垂直条纹图案
    • 水平条纹图案
    • 支持自定义图案颜色
    • 支持调节图案大小和数量
    • 支持调节图案透明度
    • 随机位置和旋转角度
  • 字母干扰增强
    • 从字体文件提取字母
    • 进行随机字母干扰或者标注

标注生成

  • 自动生成YOLO格式标注,包含边界框和类别信息

安装要求

依赖库

  • numpy
  • Pillow
  • matplotlib
  • tqdm

使用方法

0. 下载真实工业背景数据集

使用NEU-DET数据集作为真实工业背景。

1. 字体提取

bash python font_extractor.py

2. 数据集生成

bash python font_png_augmentation.py

3. 可视化验证工具

bash python visualize_annotations.py

bash python test_noise_pattern.py

bash python test_digit_augmentation.py

项目结构

IndustrialDigitDatasetGenerator/ ├── NEU-DET/ │ └── IMAGES/ ├── font_numbers/ │ ├── 0/ │ ├── 1/ │ ├── 2/ │ ├── 3/ │ ├── 4/ │ ├── 5/ │ ├── 6/ │ ├── 7/ │ ├── 8/ │ └── 9/ ├── augmented_dataset/ ├── docs/ │ └── images/ |—— default_config.py ├── font_extractor.py ├── font_png_augmentation.py ├── test_digit_augmentation.py ├── test_noise_pattern.py ├── visualize_annotations.py ├── requirements.txt └── README.md

效果展示

数据增强效果

数据增强效果 数据增强效果

图案干扰样本示意

图案干扰示意

YOLO标注可视化

标注可视化 标注可视化

搜集汇总
数据集介绍
main_image_url
构建方式
IndustrialDigitDataset的构建基于系统自带字体提取与数据增强技术。首先,该工具自动扫描并提取系统中的字体文件,过滤不适用的特殊字体,并自动裁剪和对齐数字图像。随后,通过多种数据增强技术,如噪声增强、图像变换、工业背景模拟以及随机图案和字母干扰,生成适用于工业环境的合成数据集。这些增强技术包括高斯噪声、椒盐噪声、透视变形、柏林噪声生成等,确保数据集的多样性和真实性。最后,自动生成YOLO格式的标注,包含边界框和类别信息,便于目标检测任务的使用。
特点
IndustrialDigitDataset的主要特点在于其高度定制化和真实性。数据集通过多种数据增强技术,模拟了工业环境中常见的噪声、背景和干扰,使得训练出的模型更具鲁棒性。此外,该数据集支持YOLO格式的目标检测标注,便于直接应用于现有的目标检测框架。模块化设计使得用户可以根据具体需求调整参数,灵活生成符合特定工业场景的数据集。
使用方法
使用IndustrialDigitDataset首先需要下载真实工业背景数据集NEU-DET,并按照项目结构放置。接着,通过运行font_extractor.py提取系统字体,生成数字图像。然后,运行font_png_augmentation.py进行数据增强,生成最终的数据集。为验证数据集的有效性,可使用visualize_annotations.py进行标注可视化,或使用test_noise_pattern.py和test_digit_augmentation.py测试噪声和数字增强效果。所有操作均依赖于Python环境,需确保安装了numpy、Pillow、matplotlib和tqdm等依赖库。
背景与挑战
背景概述
IndustrialDigitDatasetGenerator 是一个专门用于生成工业场景下数字图像数据集的工具,由主要研究人员或机构开发,旨在解决工业仪表检测、仪表自动化、仪表盘读数识别等领域的核心问题。该数据集通过从系统自带字体中提取数字(0-9),并结合多种数据增强技术,生成适用于工业环境的合成数据集,支持YOLO格式的目标检测标注。自创建以来,该数据集在工业数字图像处理领域产生了显著影响,为相关研究提供了丰富的数据资源和工具支持。
当前挑战
IndustrialDigitDatasetGenerator 在构建过程中面临多项挑战。首先,提取系统字体并生成高质量的数字图像需要精确的图像处理技术,以确保数据的准确性和适用性。其次,数据增强技术的多样性和复杂性要求工具具备高度的灵活性和可调节性,以适应不同工业环境的需求。此外,生成符合YOLO格式的标注数据需要精确的边界框和类别信息,这对标注生成的自动化程度提出了高要求。最后,如何确保生成的数据集在实际应用中具有高度的可靠性和鲁棒性,是该工具面临的重要挑战。
常用场景
经典使用场景
IndustrialDigitDataset在工业自动化领域中,经典的使用场景主要集中在工业仪表的读数识别与自动化检测。该数据集通过生成包含工业背景和多种数据增强技术的数字图像,为训练高精度的目标检测模型提供了丰富的数据资源。特别适用于需要高鲁棒性和环境适应性的工业仪表读数识别任务,如仪表盘、游标卡尺等设备的自动读数系统。
解决学术问题
IndustrialDigitDataset解决了工业环境中数字图像识别的常见学术问题,如复杂背景下的数字识别、噪声干扰下的目标检测等。通过提供高质量的合成数据,该数据集显著提升了模型在实际工业场景中的表现,推动了工业自动化和仪表检测领域的研究进展。其意义在于为学术界提供了一个标准化的数据集,促进了相关算法和技术的创新与应用。
衍生相关工作
基于IndustrialDigitDataset,衍生了许多相关的经典工作,包括但不限于工业仪表读数识别算法的研究、数据增强技术的优化以及目标检测模型的改进。例如,有研究利用该数据集训练的模型在工业仪表读数识别任务中取得了显著的性能提升,推动了工业自动化技术的发展。此外,该数据集还激发了更多关于合成数据生成和应用的研究,为工业领域的数据科学提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作