cadevolve
收藏Hugging Face2026-02-19 更新2026-02-20 收录
下载链接:
https://huggingface.co/datasets/kulibinai/cadevolve
下载链接
链接失效反馈官方服务:
资源简介:
CADEvolve 是一个用于 CAD 逆向工程的合成数据集,基于可执行的 CadQuery 程序构建。该数据集通过 CADEvolve 流水线生成,该流水线将一组基本图元演化为 8000 个复杂的参数化生成器,并进一步扩展为约 130 万个 CAD 程序脚本,涵盖了广泛的 CadQuery 操作集。数据集仓库包含三个主要文件夹:CADEvolve-G/ 存储参数化生成器程序和预计算的嵌入向量;CADEvolve-P/ 和 CADEvolve-C/ 则分别包含不同类别的 .py 格式 CAD 程序。该数据集适用于 CAD 逆向工程、程序合成和参数化设计等研究领域。
创建时间:
2026-02-18
搜集汇总
数据集介绍
构建方式
在计算机辅助设计领域,逆向工程需要高质量的合成数据集以支持算法训练与评估。CADEvolve数据集通过程序演化技术构建,其核心流程始于一组基础几何图元,利用演化算法逐步生成约八千个复杂的参数化生成器。这些生成器随后被扩展为约一百三十万条可执行的CadQuery脚本,覆盖了广泛的CAD操作集合,从而形成一个规模庞大且多样化的合成数据集。
特点
CADEvolve数据集展现出多方面的显著特点,其核心在于全部数据均由可执行的CadQuery程序构成,确保了高度的可重现性与程序化控制能力。数据集不仅包含参数化生成器库,还提供了预计算的嵌入向量,便于检索与索引操作。此外,数据按不同来源与处理阶段组织为多个子集,如ABC、CADEvolve-core及ShapeNet等,结构清晰且便于针对性使用。
使用方法
针对CAD逆向工程及相关研究任务,该数据集提供了灵活的应用途径。用户可直接调用参数化生成器程序,动态生成多样化的CAD几何模型;或利用预存的脚本文件进行批量处理与分析。数据集的结构化设计支持按需访问不同子集,例如专注于核心演化结果或结合外部数据集衍生内容,为机器学习模型训练、程序合成验证等研究场景提供丰富资源。
背景与挑战
背景概述
计算机辅助设计(CAD)作为现代工程与制造领域的核心技术,其逆向工程旨在从现有几何模型中恢复可编辑的参数化程序,以支持设计重用与自动化修改。CADEvolve数据集由Maksim Elistratov等研究人员于2026年提出,依托程序演化技术,构建了一个大规模合成数据集,专注于CAD逆向工程的研究。该数据集通过演化少量原始操作,生成了约8000个复杂参数化生成器,并扩展为包含约130万脚本的程序语料库,全面覆盖了CadQuery操作集,为CAD程序理解与生成任务提供了丰富的基准资源,推动了参数化设计智能化的前沿探索。
当前挑战
在CAD逆向工程领域,核心挑战在于如何从静态几何模型中准确推断出高层参数化结构,以实现设计的灵活调整与语义保持。CADEvolve数据集针对此问题,需克服程序语义的多样性表达与几何约束的复杂映射难题。在构建过程中,数据集面临程序演化策略的设计挑战,包括确保生成程序的执行可行性、避免无效或冗余操作,以及维持生成模型在几何复杂性与参数多样性之间的平衡,从而保证合成数据的真实性与实用性,为机器学习模型提供高质量的训练基础。
常用场景
经典使用场景
在计算机辅助设计(CAD)领域,逆向工程旨在从现有几何模型中恢复可编辑的参数化程序。CADEvolve数据集通过其合成的CadQuery脚本库,为这一任务提供了丰富的训练与评估资源。研究者可利用该数据集开发机器学习模型,学习从三维形状到生成性代码的映射,从而自动化CAD程序的生成过程,显著提升设计效率与灵活性。
实际应用
在实际工业设计中,CADEvolve能够支持自动化设计工具的开发,例如快速原型生成与设计变体探索。工程师可以基于数据集训练的系统,将概念草图或扫描模型转换为可修改的CAD脚本,加速产品迭代。此外,它在教育领域也有潜力,用于教学参数化设计原理,帮助学生理解几何构建与程序化建模之间的关联。
衍生相关工作
围绕CADEvolve,已衍生出多项经典研究工作,主要集中在神经程序合成与几何深度学习交叉领域。例如,研究者利用其训练序列到序列模型,实现从点云到CadQuery代码的转换;还有工作探索基于检索的方法,从数据集中匹配相似程序以辅助设计。这些进展共同丰富了CAD智能化研究的工具箱,为后续更复杂的工程应用奠定基础。
以上内容由遇见数据集搜集并总结生成



