ABC数据集
收藏arXiv2025-07-10 更新2025-08-15 收录
下载链接:
https://drive.google.com/drive/folders/1LAPl_khJ3VcO1YldGez6p7XWcDCiOK5S
下载链接
链接失效反馈官方服务:
资源简介:
ABC数据集是一个包含超过33,000个真实世界机械CAD模型的数据库,用于训练和测试。该数据集是从公开可用的ABC数据集中精心挑选的,旨在提供用于训练和测试的机械CAD模型。数据集的大小和多样性使其成为研究和开发基于深度学习的几何深度学习框架的理想选择。
The ABC Dataset is a database containing over 33,000 real-world mechanical CAD models for training and testing. This dataset is meticulously curated from the publicly available ABC Dataset, aiming to provide mechanical CAD models for training and testing purposes. Its scale and diversity make it an ideal choice for researching and developing deep learning-based geometric deep learning frameworks.
提供机构:
宾夕法尼亚州立大学工业与制造工程系
创建时间:
2025-07-10
搜集汇总
数据集介绍

构建方式
ABC数据集源自公开可用的ABC基准数据集,经过严格筛选和预处理,专注于机械CAD模型的几何深度学习研究。构建过程中,首先筛选出单连通组件且无边界、亏格值小于3的CAD模型,共计33,327个。随后通过显式各向同性重网格算法优化网格质量,确保顶点数在1,750至2,250之间,最终保留32,841个高质量模型。每个模型经过归一化处理并随机旋转,扩充至164,205个样本,以增强模型对旋转不变性的学习能力。
特点
ABC数据集的特点在于其专注于真实世界的机械CAD模型,具有高度的几何多样性和复杂性。数据集中的模型经过严格筛选和优化,确保了数值稳定性和几何一致性。每个模型的拉普拉斯-贝尔特拉米(LB)谱通过线性有限元方法计算,覆盖了广泛的数值范围,从5.8985×10−2到1.4265×109,体现了数据集的尺度变异性。此外,数据集的归一化和旋转增强处理,使其适用于几何深度学习的训练和评估。
使用方法
ABC数据集的使用方法包括数据预处理、特征提取和模型训练。预处理阶段涉及网格的归一化和旋转增强,以提升模型的泛化能力。特征提取阶段包括计算网格的几何特征,如高斯曲率、平均曲率和主曲率等,作为图卷积网络(GCN)的输入。训练阶段采用监督学习方法,使用RPD损失函数和ADAM优化器,通过两阶段学习率调度优化模型性能。最终模型可用于高效预测CAD模型的LB谱,适用于工业设计中的快速决策和质量控制。
背景与挑战
背景概述
ABC数据集由Koch等人于2019年创建,是一个包含100,000个机械CAD模型的大规模几何深度学习基准数据集,源自包含百万级模型的母集。该数据集由柏林工业大学、纽约大学等机构联合开发,旨在为三维形状分析、模型检索等几何深度学习任务提供标准化测试平台。作为黎曼几何中拉普拉斯-贝尔特拉米算子谱研究的基准数据源,ABC数据集通过提供高质量参数化网格模型,推动了计算机辅助设计、工业质检等领域的算法发展。2025年An等人基于该数据集构建的32,841个单组件机械零件子集,首次实现了通过图卷积网络预测前50个LB特征值的突破性研究。
当前挑战
ABC数据集面临的挑战主要体现在两个维度:在领域问题层面,拉普拉斯-贝尔特拉米谱计算存在有限元方法计算复杂度高(O(Nk))的瓶颈,难以满足工业场景下实时质检的需求;在构建过程层面,原始网格需经过各向同性重网格化处理以稳定数值计算,但约1.5%的复杂几何体会因拓扑畸变导致处理失败。此外,数据预处理需解决尺度变异(特征值跨度达10^11量级)和旋转不变性等几何表征难题,通过单位立方体归一化与随机旋转变换增强才使深度学习方法得以有效训练。
常用场景
经典使用场景
ABC数据集在几何深度学习和计算机视觉领域具有广泛的应用,特别是在处理三维机械CAD模型时。该数据集常用于训练和评估图卷积网络(GCN)等深度学习模型,以高效预测Laplace-Beltrami(LB)算子的谱特征。通过提取网格的几何特征(如高斯曲率、平均曲率和主曲率),ABC数据集为研究LB谱的学习性提供了坚实的基础。
实际应用
在实际应用中,ABC数据集为工业设计和制造领域提供了重要支持。例如,在质量控制中,快速获取LB谱特征可以用于检测零件的几何偏差;在CAD模型检索中,LB谱作为形状的“DNA”能够高效匹配相似模型。此外,该数据集还可用于统计过程控制(SPC),帮助优化制造流程。
衍生相关工作
ABC数据集衍生了许多经典研究工作,尤其是在几何深度学习领域。例如,基于该数据集的GCN架构被广泛用于预测LB谱,相关成果发表在顶级会议和期刊上。此外,该数据集还促进了其他几何特征提取方法的发展,如混合Voronoi区域和离散曲率的计算。这些工作进一步推动了非欧几里得数据上的深度学习研究。
以上内容由遇见数据集搜集并总结生成



