CAD-VGDrawing
收藏arXiv2025-08-26 更新2025-08-28 收录
下载链接:
https://doi.org/10.1145/3746027.3755782
下载链接
链接失效反馈官方服务:
资源简介:
CAD-VGDrawing 数据集是一个包含超过15万个工程图纸和对应参数化CAD模型的大型数据集。该数据集旨在为从二维向量工程图纸到参数化CAD模型的跨模态生成提供支持,通过直接处理SVG原始数据来保留精确的几何信息和空间关系。数据集包含多种视图配置的工程图纸,并通过FreeCAD和CairoSVG工具进行预处理和格式转换,以便于深度学习模型的训练和应用。
CAD-VGDrawing Dataset is a large-scale dataset containing over 150,000 engineering drawings and their corresponding parametric CAD models. This dataset aims to support cross-modal generation from 2D vector engineering drawings to parametric CAD models, and retains precise geometric information and spatial relationships by directly processing raw SVG data. The dataset includes engineering drawings with multiple view configurations, and is preprocessed and format-converted using FreeCAD and CairoSVG tools to facilitate the training and deployment of deep learning models.
提供机构:
浙江大学, 浙江大学, 深圳大数据研究院, 广州大学, 中国科学技术大学
创建时间:
2025-08-26
搜集汇总
数据集介绍

构建方式
CAD-VGDrawing数据集的构建依托于DeepCAD数据集中的CAD模型,通过定制Python脚本在FreeCAD环境中自动转换STEP文件为工程图,并导出为SVG格式。为确保几何信息的精确性,对矢量图进行了系统性预处理,包括路径重排序、轮廓识别与标准化视图框归一化处理,最终形成包含157,591组矢量工程图与参数化CAD模型配对的高质量数据集。
特点
该数据集的核心特点在于其多视图配置的完整性,提供单轴测图、三正交视图及四视图组合三种输入模式,充分覆盖工程设计中的多样化表达需求。矢量格式的工程图天然保留了精确的几何原语与空间关系,避免了栅格图像中常见的分辨率依赖与特征提取失真问题,为CAD序列生成提供了结构清晰、语义丰富的输入源。
使用方法
数据集适用于序列到序列的跨模态生成任务,尤其支持基于Transformer架构的CAD操作序列预测研究。使用者可通过解析SVG命令序列(如LineTo与CubicBézier)提取几何参数,结合视图标签嵌入与双解码器机制,生成参数化CAD操作命令。生成的序列可通过OpenCASCADE内核重建为三维CAD模型,并通过命令准确率、参数精度及形状相似度等指标进行量化评估。
背景与挑战
背景概述
CAD-VGDrawing数据集由杭州电子科技大学与浙江大学联合团队于2025年创建,专注于解决工程草图到参数化CAD模型的自动转换问题。该数据集包含超过15万组矢量工程图与CAD模型的配对数据,涵盖等轴测图和三视图等多种视角配置。其核心研究在于通过序列到序列学习框架,将SVG格式的矢量图元直接映射为参数化CAD操作序列,显著提升了设计意图保持度和几何精度,为工业设计流程的智能化转型提供了关键数据支撑。
当前挑战
该数据集主要应对工程草图到CAD模型转换中的双重挑战:在领域问题层面,需解决二维矢量草图与三维参数化CAD模型间的模态鸿沟,以及几何约束与设计意图的精确保持问题;在构建层面,面临SVG文件解析复杂性、多视图几何一致性对齐,以及大规模数据清洗中无效模型过滤等工程挑战。
常用场景
经典使用场景
在计算机辅助设计领域,CAD-VGDrawing数据集为序列到序列学习提供了关键支持,其经典应用场景聚焦于从矢量工程图纸自动生成参数化CAD模型。该数据集通过配对SVG格式的二维工程图与三维CAD操作序列,使得研究人员能够训练模型解析几何图元并输出精确的构造命令,从而在工业设计流程中实现从草图到三维模型的自动化转换。
解决学术问题
该数据集解决了传统方法中从栅格图像提取几何信息时精度不足的学术难题,通过矢量图元直接保留尺寸约束和空间关系,显著提升了CAD生成任务的几何保真度。其意义在于弥合了二维工程图与三维参数化建模之间的模态鸿沟,为基于深度学习的CAD序列生成提供了标准化基准,推动了设计意图保真与自动化建模技术的融合发展。
衍生相关工作
该数据集催生了多项创新研究,例如基于双解码器Transformer的CAD命令生成架构、融合视图标签的跨模态嵌入方法,以及针对参数容错性的软目标分布损失函数。这些工作扩展了矢量图形与CAD操作的联合表示学习,为后续研究如多视图融合、几何约束推理等方向奠定了理论基础与实践范式。
以上内容由遇见数据集搜集并总结生成



