AutoMate

Name: AutoMate
Creator: 华盛顿大学, 哥伦比亚大学, PTC公司, Adobe公司
Published: 2021-10-05 06:32:46
License: 暂无描述

arXiv2021-10-05 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2105.12238v2

下载链接

链接失效反馈

官方服务：

资源简介：

AutoMate数据集是由华盛顿大学、哥伦比亚大学、PTC公司和Adobe公司合作创建的，专注于CAD装配自动匹配的大型数据集。该数据集包含了92,529个独特的顶级装配，涵盖了从1到13,183个匹配的不同规模，平均每个装配包含12个匹配。数据集通过清理和去重处理，确保了数据的质量和独特性。AutoMate数据集的应用领域主要集中在计算机辅助设计（CAD）领域，旨在通过机器学习技术优化装配过程，提高设计效率和精确度。

The AutoMate dataset is a large-scale dataset co-developed by the University of Washington, Columbia University, PTC Inc., and Adobe Inc., focusing on automated matching of CAD assemblies. This dataset contains 92,529 unique top-level assemblies, covering varying scales where the number of matching components ranges from 1 to 13,183, with an average of 12 matching components per assembly. Strict cleaning and deduplication procedures are applied to the dataset to ensure its data quality and uniqueness. The primary application domain of the AutoMate dataset lies in the field of computer-aided design (CAD), where it aims to optimize assembly processes via machine learning technologies to improve design efficiency and accuracy.

提供机构：

华盛顿大学, 哥伦比亚大学, PTC公司, Adobe公司

创建时间：

2021-05-26

搜集汇总

数据集介绍

构建方式

在计算机辅助设计（CAD）领域，装配建模是核心任务之一，然而现有研究多依赖网格或点云，难以兼容CAD中主流的参数化边界表示（BREP）数据结构。为弥补这一空白，AutoMate数据集应运而生。该数据集通过爬取Onshape平台上的公开CAD文档，收集了255,213个包含至少一个配合关系的装配体，总计3,989,164个配合。随后，研究团队对数据进行了严格的清洗：展开并扁平化所有子装配引用，仅保留顶级装配；移除不完整配合及多配合对；利用BREP指纹（包括拓扑实体数量、惯性张量和质心）对重复零件和装配进行去重。最终得到92,529个唯一顶级装配和541,635个唯一配合，以及376,362个唯一BREP模型，构建了首个大规模BREP装配与配合数据集。

特点

AutoMate数据集的核心特点在于其基于BREP拓扑结构的异构性。与仅包含面节点表示的同质图不同，该数据集完整保留了面、环、边、顶点四类拓扑实体及其参数化几何信息，并记录了它们之间的边界与组成关系。这一设计使得配合约束能够精确地定义在任意拓扑实体上，而非全局坐标，从而支持高精度的机械运动建模和参数化适应性。此外，数据集涵盖了八种配合类型（如紧固、旋转、平面等），并提供了配合坐标系的详细定义，包括原点和朝向的参考拓扑实体。数据集的规模与多样性（装配体大小从1到13,183个配合不等）为学习局部拓扑表示和跨类别泛化提供了坚实基础。

使用方法

AutoMate数据集专为训练和评估基于BREP的配合预测模型而设计。使用时可将其划分为位置预测和类型预测两个基准任务：位置任务要求模型根据用户选定的面和零件，从所有可能的配合坐标系对中排序并推荐正确的配合位置；类型任务则需在已知配合位置的情况下，预测配合的类型（如旋转或滑动）。研究者可采用结构化BREP图卷积网络（SB-GCN）作为基线模型，该网络通过分层消息传递机制学习各拓扑实体的嵌入表示，并结合全局零件特征进行分类。数据集的训练集、验证集和测试集已按配合对划分，并提供了数据增强策略（如构建等效配合坐标系），以缓解假阴性问题。代码和预处理后的特征化数据均开源，便于复现与扩展。

背景与挑战

背景概述

装配建模是计算机辅助设计（CAD）工作流中的核心任务，约占整个CAD工作量的三分之一，其优化对于提升设计效率具有重大意义。然而，现有基于机器学习的装配建模研究多采用网格或点云等非参数化几何表示，难以与现代CAD系统基于参数化边界表示（BREP）的数据结构兼容，且无法利用拓扑实体定义具有解析精度的配合约束。为填补这一空白，来自华盛顿大学、哥伦比亚大学、PTC公司和Adobe公司的研究团队于2021年共同创建了AutoMate数据集。该数据集是首个大规模BREP CAD装配数据集，包含超过92,000个独特装配和541,000余个独特配合，旨在解决基于BREP拓扑的自动配合预测问题。AutoMate的提出不仅为CAD领域的机器学习研究提供了关键数据基础，还通过其配套的SB-GCN图神经网络模型，展示了将学习模型无缝集成到商业CAD系统中的可行性，对推动智能CAD装配工具的发展产生了深远影响。

当前挑战

AutoMate数据集所面临的挑战主要源于两个方面。首先，在领域问题层面，CAD配合预测具有高度的主观性和歧义性，同一对零件在不同设计意图下可能对应多种合理的配合位置与类型，而数据集仅包含单一真实标注，导致模型训练中难以全面覆盖用户意图，且评估指标可能低估模型实际表现。其次，在数据构建过程中，挑战尤为突出：原始爬取的255,000余个装配中存在大量重复和层次化子装配，需通过BREP指纹进行去重与规范化；配合模型需兼容8种配合类型和多种拓扑实体引用，而部分配合包含旋转偏移等复杂参数，需进行简化与标准化处理；此外，构建用于训练的正负样本对时，需对每个选中的面生成大量候选配合对，部分选择示例的候选对数量超过10,000，对计算资源和内存管理提出了严峻考验。

常用场景

经典使用场景

在计算机辅助设计（CAD）领域，装配建模是核心任务之一，占据整个工作流程约三分之一的时间。AutoMate数据集专为自动匹配CAD装配中的零件而设计，其经典使用场景在于辅助设计师在装配过程中快速、准确地定义零件间的配对约束。用户通过选择一对零件并大致指示匹配位置，系统利用基于边界表示（BREP）的图神经网络SB-GCN，为每个拓扑实体生成嵌入，进而预测并推荐最合适的匹配方案。这一过程显著提升了装配效率，减少了手动调整的繁琐步骤。

实际应用

在实际应用中，AutoMate数据集及其配套模型已成功集成至商业CAD系统（如Onshape），以插件形式提供交互式推荐功能。设计师在装配过程中选择零件后，系统可实时生成至多六个候选匹配位置，准确率达72.2%，并进一步预测匹配类型（如固定、旋转、滑动等）。这一工具大幅降低了手动定位和约束定义的时间成本，尤其适用于复杂机械装配场景，如工业设备、消费电子产品等，显著提升了设计迭代效率与模型一致性。

衍生相关工作

AutoMate数据集衍生了一系列开创性工作，推动了CAD数据学习领域的发展。其提出的SB-GCN模型为后续BREP表示学习研究奠定了基础，例如BRepNet和UV-Net等网络进一步优化了拓扑实体嵌入方法。此外，该数据集催生了关于基于约束的装配生成、多零件协同匹配以及CAD工作流自动化等方向的研究。未来工作可拓展至非面拓扑选择、全局装配上下文整合及零件检索与放置的联合优化，从而构建更智能的端到端装配辅助系统。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集