cadevolve

Hugging Face2026-02-19 更新2026-02-20 收录

下载链接：

https://huggingface.co/datasets/kulibinai/cadevolve

下载链接

链接失效反馈

官方服务：

资源简介：

CADEvolve 是一个用于 CAD 逆向工程的合成数据集，基于可执行的 CadQuery 程序构建。该数据集通过 CADEvolve 流水线生成，该流水线将一组基本图元演化为 8000 个复杂的参数化生成器，并进一步扩展为约 130 万个 CAD 程序脚本，涵盖了广泛的 CadQuery 操作集。数据集仓库包含三个主要文件夹：CADEvolve-G/ 存储参数化生成器程序和预计算的嵌入向量；CADEvolve-P/ 和 CADEvolve-C/ 则分别包含不同类别的 .py 格式 CAD 程序。该数据集适用于 CAD 逆向工程、程序合成和参数化设计等研究领域。

创建时间：

2026-02-18

搜集汇总

数据集介绍

构建方式

在计算机辅助设计领域，逆向工程需要高质量的合成数据集以支持算法训练与评估。CADEvolve数据集通过程序演化技术构建，其核心流程始于一组基础几何图元，利用演化算法逐步生成约八千个复杂的参数化生成器。这些生成器随后被扩展为约一百三十万条可执行的CadQuery脚本，覆盖了广泛的CAD操作集合，从而形成一个规模庞大且多样化的合成数据集。

特点

CADEvolve数据集展现出多方面的显著特点，其核心在于全部数据均由可执行的CadQuery程序构成，确保了高度的可重现性与程序化控制能力。数据集不仅包含参数化生成器库，还提供了预计算的嵌入向量，便于检索与索引操作。此外，数据按不同来源与处理阶段组织为多个子集，如ABC、CADEvolve-core及ShapeNet等，结构清晰且便于针对性使用。

使用方法

针对CAD逆向工程及相关研究任务，该数据集提供了灵活的应用途径。用户可直接调用参数化生成器程序，动态生成多样化的CAD几何模型；或利用预存的脚本文件进行批量处理与分析。数据集的结构化设计支持按需访问不同子集，例如专注于核心演化结果或结合外部数据集衍生内容，为机器学习模型训练、程序合成验证等研究场景提供丰富资源。

背景与挑战

背景概述

计算机辅助设计（CAD）作为现代工程与制造领域的核心技术，其逆向工程旨在从现有几何模型中恢复可编辑的参数化程序，以支持设计重用与自动化修改。CADEvolve数据集由Maksim Elistratov等研究人员于2026年提出，依托程序演化技术，构建了一个大规模合成数据集，专注于CAD逆向工程的研究。该数据集通过演化少量原始操作，生成了约8000个复杂参数化生成器，并扩展为包含约130万脚本的程序语料库，全面覆盖了CadQuery操作集，为CAD程序理解与生成任务提供了丰富的基准资源，推动了参数化设计智能化的前沿探索。

当前挑战

在CAD逆向工程领域，核心挑战在于如何从静态几何模型中准确推断出高层参数化结构，以实现设计的灵活调整与语义保持。CADEvolve数据集针对此问题，需克服程序语义的多样性表达与几何约束的复杂映射难题。在构建过程中，数据集面临程序演化策略的设计挑战，包括确保生成程序的执行可行性、避免无效或冗余操作，以及维持生成模型在几何复杂性与参数多样性之间的平衡，从而保证合成数据的真实性与实用性，为机器学习模型提供高质量的训练基础。

常用场景

经典使用场景

在计算机辅助设计（CAD）领域，逆向工程旨在从现有几何模型中恢复可编辑的参数化程序。CADEvolve数据集通过其合成的CadQuery脚本库，为这一任务提供了丰富的训练与评估资源。研究者可利用该数据集开发机器学习模型，学习从三维形状到生成性代码的映射，从而自动化CAD程序的生成过程，显著提升设计效率与灵活性。

实际应用

在实际工业设计中，CADEvolve能够支持自动化设计工具的开发，例如快速原型生成与设计变体探索。工程师可以基于数据集训练的系统，将概念草图或扫描模型转换为可修改的CAD脚本，加速产品迭代。此外，它在教育领域也有潜力，用于教学参数化设计原理，帮助学生理解几何构建与程序化建模之间的关联。

衍生相关工作

围绕CADEvolve，已衍生出多项经典研究工作，主要集中在神经程序合成与几何深度学习交叉领域。例如，研究者利用其训练序列到序列模型，实现从点云到CadQuery代码的转换；还有工作探索基于检索的方法，从数据集中匹配相似程序以辅助设计。这些进展共同丰富了CAD智能化研究的工具箱，为后续更复杂的工程应用奠定基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集