Public Handwritten Circuit Images Dataset
收藏arXiv2021-07-22 更新2024-06-21 收录
下载链接:
https://git.opendfki.de/circuitgraph-public/cghd/
下载链接
链接失效反馈官方服务:
资源简介:
Public Handwritten Circuit Images Dataset是由德国人工智能研究中心有限公司的智能数据与知识服务部门创建的,包含1152张手绘电路图的图像。这些图像由12位绘图者绘制,每位绘制者绘制144个电路,每个电路重复2次,共计48,563个标注。数据集中的图像捕捉了不同光照条件和视角下的电路图,使用了多种绘图工具和表面材料。数据集旨在通过提供高质量的训练和评估数据,支持机器学习和计算机视觉算法在电路图识别领域的发展,特别是解决从手绘草图到数字表示的转换问题。
Public Handwritten Circuit Images Dataset was developed by the Smart Data and Knowledge Services Department of the German Research Center for Artificial Intelligence (DFKI) GmbH. It consists of 1152 handwritten circuit diagram images created by 12 different drafters: each drafter drew 144 distinct circuits, with each circuit duplicated twice, resulting in a total of 48,563 annotations. The images in this dataset capture circuit diagrams under varying lighting conditions and perspectives, and were generated using a diverse range of drawing tools and surface substrates. This dataset aims to support the advancement of machine learning and computer vision algorithms for circuit diagram recognition by providing high-quality training and evaluation data, particularly addressing the challenge of converting hand-drawn sketches into digital representations.
提供机构:
智能数据与知识服务部门,德国人工智能研究中心有限公司,凯泽斯劳滕,德国
创建时间:
2021-07-22
搜集汇总
数据集介绍

构建方式
Public Handwritten Circuit Images Dataset的构建过程体现了对多样性和真实性的高度关注。该数据集由12位绘图者绘制144个电路图,每个电路图绘制两次,并通过消费级相机在不同光照条件和视角下拍摄,最终生成1152张图像。每张图像均包含手绘电路图,并涵盖了多种纸张类型、笔具和表面材料。为确保数据的丰富性,每张图纸被拍摄四次,以模拟现实世界中的图像捕捉条件。所有图像均经过手动标注,使用PascalVOC格式存储边界框和45种类别标签,同时引入辅助类别以简化电路图的提取过程。
特点
该数据集的核心特点在于其多样性和高质量标注。图像涵盖了多种绘图工具、纸张类型和表面材料,包括普通纸、方格纸、白板和铝箔等,且使用了铅笔、钢笔、永久记号笔等多种绘图工具。数据集包含48,563个标注,涵盖45种电气符号类别,并引入了辅助类别如连接点、交叉点和文本,以支持电路图的自动化提取。此外,图像捕捉条件多样化,包括自然光、运动模糊和表面反光等,确保了数据集的现实适用性。
使用方法
该数据集适用于电气工程领域的机器学习和计算机视觉任务,特别是手绘电路图的自动识别与数字化。研究人员可将数据集划分为训练集、验证集和测试集,分别包含125、7和12个电路图。通过使用Faster RCNN等目标检测算法,可以建立基线性能评估模型。数据集还可用于风格迁移学习、标注验证和图像增强研究。其多样化的捕捉条件和高质量标注为开发鲁棒的电路图识别算法提供了坚实基础。
背景与挑战
背景概述
Public Handwritten Circuit Images Dataset 是由德国人工智能研究中心(DFKI)的研究人员 Felix Thoma、Johannes Bayer 和 Yakun Li 于 2021 年创建的一个公开数据集,旨在为电气工程领域的手绘电路图数字化提供高质量的标注数据。该数据集包含 1152 张由 12 位绘图者绘制的 144 个电路图,共计 48,563 个标注,涵盖了 45 种电气元件类别。数据集的创建背景源于电气工程设计中手绘电路图向数字化表示的转换需求,这一过程通常耗时且复杂。尽管已有一些研究尝试通过在线或离线方式实现这一转换,但缺乏公开的高质量数据集限制了相关算法的进一步发展。该数据集的发布填补了这一空白,为基于机器学习和计算机视觉的电路图识别研究提供了重要支持。
当前挑战
Public Handwritten Circuit Images Dataset 面临的主要挑战包括两个方面。首先,在领域问题层面,手绘电路图的识别需要解决几何和语义上的复杂性。例如,不同绘图者可能使用不同的符号表示相同的电气元件,且电路图的绘制风格和条件(如光照、视角、纸张类型等)差异显著,这增加了算法对多样性和鲁棒性的要求。其次,在数据集构建过程中,研究人员需要应对标注的复杂性。由于电路图中的元件连接方式多样(如交叉点、连接点等),且部分元件可能包含复杂的几何形状,标注过程需要极高的精确性和一致性。此外,数据集的多样性要求通过多种绘图工具、纸张类型和拍摄条件来模拟真实场景,这进一步增加了数据采集和标注的难度。这些挑战共同构成了该数据集在推动电路图识别技术发展中的关键障碍。
常用场景
经典使用场景
Public Handwritten Circuit Images Dataset 主要用于电气工程领域的手绘电路图识别研究。该数据集包含了1152张由12位绘图者绘制的144个电路图,涵盖了多种绘图工具和表面材料。每张图像都标注了电气元件的边界框和45种类别标签,为电路图的自动识别和转换提供了丰富的训练和评估数据。
衍生相关工作
该数据集衍生了许多相关研究工作,特别是在电路图自动识别和转换领域。例如,基于该数据集的研究可以进一步优化Faster RCNN等目标检测算法,提高电路元件的识别精度。此外,该数据集还为风格迁移学习、图像增强和自动标注验证等研究提供了基础数据。
数据集最近研究
最新研究方向
在电气工程领域,手绘电路图的数字化处理一直是研究的热点之一。近年来,随着深度学习技术的快速发展,基于图像识别的手绘电路图自动解析成为前沿研究方向。Public Handwritten Circuit Images Dataset的发布为这一领域提供了重要的数据支持。该数据集包含1152张手绘电路图图像,涵盖了多种绘图工具、纸张类型和拍摄条件,并提供了48563个标注,涵盖了45种电路符号类别。当前研究主要集中在如何利用该数据集提升电路图识别的准确性和鲁棒性,特别是在复杂光照和视角变化下的图像处理能力。此外,结合生成对抗网络(GAN)进行数据增强,以及利用图神经网络(GNN)进行电路图的结构化解析,也成为该领域的热点研究方向。这些研究不仅推动了电路设计自动化的进程,也为相关领域的图像识别任务提供了重要参考。
相关研究论文
- 1A Public Ground-Truth Dataset for Handwritten Circuit Diagram Images智能数据与知识服务部门,德国人工智能研究中心有限公司,凯泽斯劳滕,德国 · 2021年
以上内容由遇见数据集搜集并总结生成



