Zero-to-CAD
收藏arXiv2026-04-27 更新2026-04-29 收录
下载链接:
https://huggingface.co/collections/ADSKAILab/zero-to-cad
下载链接
链接失效反馈官方服务:
资源简介:
Zero-to-CAD是由欧特克研究院开发的百万规模可执行CAD程序数据集,采用基于大语言模型的智能体搜索框架合成,覆盖布尔运算、倒角、放样等多样化机械设计操作。数据集包含约100万条参数化构建序列及10万精选子集,通过代码执行验证确保几何有效性,填补了传统B-Rep数据缺乏设计意图的空白。其合成过程结合提示工程与文档检索,支持从零生成可读、可编辑的CAD代码,为AI辅助设计提供训练资源,应用于图像到CAD序列重建等任务。
Zero-to-CAD is a million-scale executable CAD program dataset developed by Autodesk Research. It is synthesized using an LLM-based AI Agent search framework, covering diverse mechanical design operations such as boolean operations, chamfering, lofting and more. The dataset contains approximately 1 million parametric construction sequences and a curated subset of 100,000 entries. Geometric validity is ensured through code execution verification, filling the gap that traditional B-Rep data lacks design intent. Its synthesis process combines prompt engineering and document retrieval, supporting the generation of readable and editable CAD code from scratch. It provides training resources for AI-aided design and has been applied to tasks such as image-to-CAD sequence reconstruction.
提供机构:
欧特克研究院
创建时间:
2026-04-27
搜集汇总
数据集介绍

构建方式
Zero-to-CAD采用了一种基于智能体搜索的合成流水线,将大语言模型嵌入一个具备反馈机制的CAD环境中。该环境为模型配备了代码执行与验证、文档检索及正则语法匹配三项工具,使其能够迭代地生成、执行并修正CadQuery代码。整个流程分为两阶段:首先由模型生成按65个预定义类别组织的零件描述目录,随后依据每条描述生成对应的可执行CAD程序,并通过多轮修复循环确保几何有效性与多样性。最终产出约一百万个可执行、可读且可编辑的CAD序列,并从中筛选出十万个高多样性子集。
使用方法
研究者可直接将数据用于训练或微调序列生成模型,如从多视图图像重建可编辑CAD程序。数据集提供了完整的训练/验证/测试划分,并附带预计算的DINOv3嵌入与FAISS索引,便于进行高效相似性搜索。此外,精选的十万子集为计算资源有限的团队提供了更易入手的切入点。示例实验表明,基于该合成数据微调的2B参数视觉语言模型,能够从二维渲染图像生成高保真度的CadQuery代码,在分布内测试集上达到82.1%的成功率与0.747的平均IoU,并有效泛化至真实CAD数据。
背景与挑战
背景概述
计算机辅助设计(CAD)模型的核心在于其构造历史——一种编码了设计意图的参数化序列。然而,现有的大规模三维数据集,如ABC和Objaverse,主要包含边界表示或网格,缺失了这段关键的过程性信息。尽管DeepCAD和Fusion 360 Gallery等数据集提供了构造序列,但它们局限于草图-拉伸这类简单操作,无法涵盖倒角、圆角、布尔运算等真实设计中的丰富操作。为解决这一数据稀缺问题,Autodesk Research的Mohammadmehdi Ataei等人在2026年提出了Zero-to-CAD数据集。该工作通过将大语言模型嵌入具备反馈机制的CAD环境中,以智能体搜索的方式迭代生成、执行并验证代码,成功合成了约100万条可执行、可读且可编辑的CAD构造序列,并从中精选出10万个高质量模型。这一数据集弥合了几何规模与参数化可解释性之间的鸿沟,为下一代CAD人工智能研究提供了关键资源。
当前挑战
Zero-to-CAD所应对的核心领域挑战在于,现有CAD数据集要么缺乏构造历史,要么操作类型狭隘(如仅含草图-拉伸),无法支撑对设计意图的完整建模与生成。该数据集在构建过程中亦面临多重挑战:其一,如何将大语言模型对机械设计的语义先验转化为符合CAD内核语法的可执行代码,这需要解决模型在单次生成中难以保证几何有效性的问题;其二,需设计一套包含代码执行、几何验证(如拓扑完整性、单一连通体、最小复杂度)及多格式导出的严格验证框架,以剔除无效或退化解;其三,为防止生成模式坍塌,必须通过结构化分类(65类部件)、参考代码片段及提示随机性等手段,确保输出在形状与操作类型上的广泛覆盖;其四,在百万级规模下,需构建可弹性扩展的推理与验证基础设施,以应对数千并发任务对计算资源的动态需求。
常用场景
经典使用场景
在计算机辅助设计(CAD)与人工智能的交叉领域中,Zero-to-CAD数据集的核心经典用途在于为序列化CAD模型生成任务提供大规模、可解释的监督信号。与传统几何数据集截然不同,该数据集提供了近百万条可执行、可阅读、可编辑的CAD构建序列,覆盖了从基础草图拉伸到布尔运算、倒角、放样、扫描、抽壳等丰富操作。因此,研究者常将其作为训练和评估序列生成模型的标准基准,尤其适用于从多视角图像或文本描述重建参数化CAD程序的任务。通过与LLM驱动的智能体循环结合,该数据集还展示了如何将大型语言模型潜在的机械设计知识转化为结构化的、可被下游模型直接利用的构建历史。
解决学术问题
Zero-to-CAD直接回应了CAD领域长期存在的数据鸿沟问题:尽管已有ABC、Objaverse等百万级3D数据集,但它们仅提供边界表示或网格,完全剥离了参数化构建历史这一关键信息。而小规模序列数据集如DeepCAD和Fusion 360 Gallery则局限于简单的草图-拉伸操作,无法捕捉真实机械设计中的丰富语汇。Zero-to-CAD通过智能体合成技术,在无需任何真实构建历史数据的前提下,生成了具备广泛操作覆盖和可解释参数的大规模序列数据集,从而首次弥合了几何规模与参数化可解释性之间的裂痕。该数据集使学术社区能够训练和评估能够理解复杂设计意图的序列模型,为从视觉或文本输入逆向工程出完备CAD程序的研究提供了坚实的数据基础。
实际应用
在实际工程环境中,Zero-to-CAD数据集的价值体现在多个层面。首先,它赋能了图像到CAD程序的自动重建系统:工程师只需拍摄或渲染出机械零件的多视角图像,便可通过在该数据集上微调的视觉-语言模型获得可编辑的CadQuery代码,极大缩短了从物理样件到数字化模型的逆向工程周期。其次,该数据集支持参数化设计方案的智能生成与迭代,为计算机辅助设计软件提供了“设计意图感知”的自动补全和推荐功能。在制造业中,其生成的带有语义参数和逻辑构建顺序的代码可直接被用于数控编程、有限元分析或3D打印的预处理流程,从而显著提升从概念设计到生产制造的数字化协同效率。
数据集最近研究
最新研究方向
Zero-to-CAD数据集代表了计算机辅助设计领域从几何表征向参数化设计意图理解的重要跃迁。在传统CAD数据仅提供边界表征或网格的背景下,该研究通过嵌入大语言模型于反馈驱动的CAD环境,以智能体搜索范式实现了约一百万条可执行、可读、可编辑的CAD构造序列的合成,覆盖了布尔运算、圆角、倒角、扫掠等丰富操作词汇。这一前沿方向的核心在于将计算资源转化为数据资产,通过无需真实设计历史的合成策略,弥合了几何规模与参数化可解释性之间的鸿沟。基于该数据集的图像到序列重建实验表明,微调后的视觉语言模型在多视角图像到CAD程序的逆向工程中显著超越包括GPT-5.2在内的强基线,成功率达到82.1%,并为建模序列能力提供了有效的自举路径,推动CAD人工智能向更贴近人类设计意图的方向发展。
相关研究论文
- 1Zero-to-CAD: Agentic Synthesis of Interpretable CAD Programs at Million-Scale Without Real Data欧特克研究院 · 2026年
以上内容由遇见数据集搜集并总结生成



