ParaCAD
收藏github2025-03-31 更新2025-04-07 收录
下载链接:
https://github.com/yuwen-chen616/PHT-CAD
下载链接
链接失效反馈官方服务:
资源简介:
ParaCAD是第一个大规模2D PPA基准,明确集成了几何和注释层。它包括10.26百万标注工程图纸用于训练和3,000个真实工业图纸用于测试。测试样本表现出更高的拓扑复杂性并遵循物理约束。
ParaCAD is the first large-scale 2D PPA benchmark that explicitly integrates geometric and annotation layers. It consists of 10.26 million annotated engineering drawings for training and 3,000 real industrial drawings for testing. The test samples exhibit higher topological complexity and adhere to physical constraints.
创建时间:
2025-03-20
原始信息汇总
PHT-CAD数据集概述
数据集简介
- 名称:ParaCAD
- 类型:2D工程图纸数据集
- 特点:
- 首个集成注释层的大规模2D参数化基元分析(PPA)基准
- 包含几何层和注释层的完整标注
- 测试集包含真实工业图纸,具有复杂拓扑结构和物理约束
数据集规模
- 训练集:10.26百万标注工程图纸
- 测试集:3,000真实工业图纸
数据集用途
- 用于训练和评估PHT-CAD框架
- 支持2D参数化基元分析研究
性能指标
- 评估指标:Acc、ParamMSE、ImgMSE、CD、CF1、PF1
- 比较方法:ResNet34、PpaCAD、Vitruvion、PICASSO
- 性能表现:在精确草图图像和手绘草图图像评估中均达到SOTA
访问方式
- 数据集地址:https://www.modelscope.cn/datasets/yuwenbonnie/ParaCAD-Dataset/summary
相关论文
- 标题:PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning
- arXiv链接:https://arxiv.org/abs/2503.18147
- 引用格式: bibtex @article{pht-cad, title={PHT-CAD: Efficient CAD Parametric Primitive Analysis with Progressive Hierarchical Tuning}, author={Niu, Ke and Chen, Yuwen and Yu, Haiyang and Chen, Zhuofan and Que, Xianghui and Li, Bin and Xue, Xiangyang}, journal={arXiv preprint arXiv:2503.18147}, year={2025} }
搜集汇总
数据集介绍

构建方式
ParaCAD数据集的构建充分考虑了工程制图领域的复杂性和实际应用需求,采用多模态对齐和渐进式分层调优技术,整合了几何层与注释层的完整标注信息。该数据集包含1026万张训练用工程图纸和3000张真实工业图纸作为测试集,测试样本具有更高的拓扑复杂度和物理约束条件,确保了数据集的多样性和实用性。
特点
ParaCAD数据集作为首个大规模集成注释层的2D PPA基准,其显著特点在于同时涵盖几何层和注释层的完整标注信息,且测试集采用真实工业场景下的复杂图纸。数据集样本覆盖从精确草图到手绘草图的多种类型,通过严格的物理约束和拓扑结构验证,为CAD参数化基元分析提供了高可靠性的评估基准。
使用方法
该数据集可通过ModelScope平台直接获取,配套提供基于PHT-CAD框架的推理Web界面。研究人员可利用训练集开发参数化基元分析模型,并通过具有复杂拓扑结构的测试集验证模型性能。数据集支持标准评估、零样本评估和维度评估三种范式,各项指标均设有专门评价头进行量化分析。
背景与挑战
背景概述
ParaCAD数据集由Niu Ke等研究人员于2025年提出,是首个大规模集成几何层与注释层的二维参数化基元分析(2D PPA)基准数据集。该数据集由模型社区(ModelScope)发布,旨在解决工程图纸分析中模态对齐与推理的关键问题。ParaCAD包含1026万张带注释的训练图纸和3000张具有复杂拓扑结构的真实工业测试图纸,为计算机辅助设计领域提供了前所未有的数据支持。其创新性地融合了几何表示与语义标注,显著提升了视觉语言模型在工程图纸解析中的性能,对智能制造、工业自动化等领域产生了深远影响。
当前挑战
在领域问题层面,ParaCAD针对传统CAD参数化基元分析中几何特征与语义标注割裂的痛点,解决了多模态数据对齐、复杂拓扑结构解析等核心挑战。数据集构建过程中,研究人员需攻克三大技术难点:真实工业图纸的物理约束建模、千万级样本的精细化标注质量控制,以及渐进式层次调优训练框架的设计。测试集的拓扑复杂度较现有数据集提升近3倍,这对标注一致性与模型泛化能力提出了极高要求。
常用场景
经典使用场景
ParaCAD数据集在计算机辅助设计(CAD)领域具有广泛的应用价值,尤其在工程图纸分析方面表现突出。该数据集通过整合几何层和注释层,为研究人员提供了一个全面的基准测试平台。其经典使用场景包括对复杂拓扑结构和物理约束的工程图纸进行精确分析,为CAD系统的智能化升级提供了数据支持。
实际应用
在实际应用中,ParaCAD数据集被广泛用于工业设计、建筑规划和机械制造等领域。其高质量的真实工业图纸和复杂拓扑结构为工程师和设计师提供了宝贵的参考资源。通过该数据集,可以实现工程图纸的自动化解析和优化,显著提升设计效率和质量。
衍生相关工作
ParaCAD数据集衍生了多项经典研究工作,其中最突出的是PHT-CAD框架。该框架利用视觉语言模型(VLMs)的模态对齐和推理能力,实现了对工程图纸的精确分析。此外,基于该数据集的研究还推动了CAD领域的其他创新,如自动化标注系统和智能设计工具的研发。
以上内容由遇见数据集搜集并总结生成



