CADBench

Name: CADBench
Creator: 麻省理工学院
Published: 2026-05-12 01:25:47
License: 暂无描述

arXiv2026-05-12 更新2026-05-13 收录

下载链接：

https://huggingface.co/datasets/DeCoDELab/CADBench

下载链接

链接失效反馈

官方服务：

资源简介：

CADBench是由麻省理工学院创建的多模态计算机辅助设计程序生成基准数据集，旨在为AI辅助设计提供统一的评估框架。该数据集包含18,000个评估样本，涵盖从DeepCAD、Fusion 360、ABC、MCB和Objaverse等六个基准家族衍生的数据，提供五种输入模态包括清洁网格、噪声网格、单视图渲染、逼真渲染和多视图渲染。数据集通过基于B-rep面数的复杂性分层和多样性感知采样构建，确保样本在几何复杂性和对象变异上具有代表性。该数据集主要应用于可编辑三维重建和多模态CAD理解领域，用于诊断模型在几何复杂性增加时的性能变化、模态偏移的鲁棒性以及跨度量标准的排名差异，旨在解决现有CAD评估碎片化的问题。

CADBench is a multimodal computer-aided design (CAD) benchmark dataset developed by the Massachusetts Institute of Technology (MIT). It is generated by CAD programs and aims to provide a unified evaluation framework for AI-assisted design. This dataset includes 18,000 evaluation samples derived from six benchmark families including DeepCAD, Fusion 360, ABC, MCB, and Objaverse, and offers five input modalities: clean meshes, noisy meshes, single-view renderings, photorealistic renderings, and multi-view renderings. Constructed via complexity stratification based on the number of B-rep faces and diversity-aware sampling, the dataset ensures that the samples are representative in terms of geometric complexity and object variability. It is primarily applied in the domains of editable 3D reconstruction and multimodal CAD understanding, used to diagnose model performance changes with increasing geometric complexity, robustness against modality shifts, and ranking differences across various metric standards, with the goal of addressing the fragmentation of existing CAD evaluation practices.

提供机构：

麻省理工学院

创建时间：

2026-05-12

原始信息汇总

数据集概述：CADBench

数据集名称： CADBench
来源地址： https://huggingface.co/datasets/DeCoDELab/CADBench

基本信息

CADBench 是一个面向计算机辅助设计（CAD）相关任务的数据集，包含多种格式的3D模型文件及对应的视觉图像数据。

数据特征

每条数据包含以下字段：

file_id（字符串）：文件唯一标识符。
label（字符串）：数据标签。
step（二进制）：STEP 格式的3D模型文件。
stl（二进制）：STL 格式的3D模型文件。
obj（二进制）：OBJ 格式的3D模型文件。
glb（二进制）：GLB 格式的3D模型文件。
singleview_image（图像）：单视角渲染图像。
multiview_image（图像）：多视角渲染图像。
pbr（图像）：基于物理渲染（PBR）的图像。
noisy_stl（二进制）：带噪声的 STL 格式文件。

数据集划分

数据集共包含3000个样本，划分为6个数据子集：

子集名称	样本数量	数据大小（字节）
bench0	3000	8,687,768,922
bench0F	3000	9,820,522,555
bench1A	3000	14,881,149,982
bench1B	3000	15,182,316,852
bench2	3000	9,795,102,660
bench3	3000	43,616,021,783

数据规模

总下载大小： 80,229,154,806 字节（约74.7 GB）
总数据集大小： 103,734,295,182 字节（约96.6 GB）

配置文件

默认配置名为 default，各子集数据文件路径如下：

bench0：data/bench0-*
bench1A：data/bench1A-*
bench1B：data/bench1B-*
bench2：data/bench2-*
bench3：data/bench3-*
bench0F：data/bench0F-*

搜集汇总

数据集介绍

构建方式

CADBench的构建源于对现有CAD程序生成评估碎片化问题的深刻洞察。研究团队从DeepCAD、Fusion 360、ABC、MCB和Objaverse五大数据集中精挑细选，构建了涵盖六类基准族（B、F、E、A、M、O）的18,000个评估样本。构建过程中，首先对STEP格式的基准族依据B-rep面片数量进行复杂度分层，划分为低、中、高三个层级，确保每个层级包含至少1,000个样本；随后，利用DINOv3提取的嵌入特征对这些分层样本进行k-means聚类与多样性采样，最终每个聚类选取近邻样本作为代表。对于仅含网格数据的族，则直接执行多样性采样。此外，每个样本均生成五种输入模态：干净网格、带噪网格、单视图渲染、多视图渲染及逼真渲染，从而构建了一个覆盖多种输入条件与几何复杂度的统一评估框架。

使用方法

CADBench为AI辅助CAD程序生成研究提供了一个标准化诊断平台。研究者可直接从Hugging Face数据集仓库获取基准数据，每个样本均配备五种输入模态与对应的地面真值CAD程序。使用时可依据研究目标灵活选择评估维度：若要分析几何复杂度影响，可选用按复杂度分层的STEP类基准族（B、F、E、A）并比较低、中、高层级的表现；若要评估模态鲁棒性，则可将模型分别应用于干净网格、带噪网格及不同图像渲染格式并对比结果。CADBench提供了统一的评估脚本与对齐程序（连续Procrustes分析），确保几何度量的一致性。研究者可使用基准涵盖的六项指标报告模型性能，并参考论文中的11个基线模型结果进行对比。该基准特别适合用于诊断模型在几何复杂度升高时的退化模式、模态偏移下的脆弱性以及不同度量下的排名变化，从而指导更鲁棒、更精确的CAD程序生成方法研发。

背景与挑战

背景概述

计算机辅助设计（CAD）模型通过结构化的参数化程序编码实体几何，为工程工作流中的设计提供精确且可编辑的操控能力。然而，创建此类模型仍是一项耗时且依赖专业知识的工作，即便经验丰富的工程师也可能需要数周时间才能构建出复杂部件的详细CAD模型。这种高昂成本催生了对人工智能系统的浓厚兴趣，这些系统旨在直接从用户输入生成可编辑的CAD程序。然而，现有评估体系碎片化严重，分散于不同数据集、模态与指标之间，难以有效衡量进展。为弥合这一鸿沟，麻省理工学院的研究团队于2025年提出了CADBench。该基准测试包含18,000个评估样本，横跨六个基准系列、五种输入模态与六项评估指标，旨在统一多模态CAD程序生成的评测范式。其对领域中系统性评估的缺失构成了关键补全，为衡量可编辑三维重建与多模态CAD理解提供了强力的诊断平台。

当前挑战

CADBench所面临的挑战首先体现在领域问题的复杂性上：CAD程序生成不仅要求几何保真度，还需确保程序的可执行性与输出简洁性，现有方法在几何复杂度增加时性能显著退化，且不同模型对输入模态变化的鲁棒性差异悬殊。其次，基准构建过程亦充满艰难：现有数据集多局限于单一操作类型（如草图-拉伸），覆盖的几何复杂度和视觉多样性有限；许多数据集缺少可直接编辑的CAD序列，且STEP格式与网格格式间的复杂度度量标准各异。此外，为构建复杂度分层与多样性感知的评估切分，团队需对大量三维模型进行特征提取、聚类与筛选，同时生成清洁与噪声网格、多种渲染模态等标准化输入，这一流程不仅计算开销巨大，还需要保证所有数据来源的可复现性与合法授权。

常用场景

经典使用场景

CADBench作为统一的跨模态基准数据集，主要服务于从二维图像或三维观测中恢复可编辑CAD程序的任务。其经典使用场景涵盖五种输入模态——干净网格、含噪网格、单视图渲染、光真实感渲染及多视图渲染，并横跨源自DeepCAD、Fusion 360、ABC、MCB和Objaverse的六个基准家族。研究者利用该数据集评估模型在不同几何复杂度与多样性条件下的重建性能，尤其关注从简单几何体到复杂机械零件及有机形态的泛化能力，从而系统性衡量CAD程序生成模型的稳健性与准确性。

解决学术问题

该数据集有效解决了当前CAD生成领域评估分散、指标不统一的困境。通过提供18,000个标准化样本及六项评价指标——体积交并比、表面交并比、倒角距离、有效形状率、令牌数与操作数——CADBench使得研究者能够在统一框架下对比不同方法的几何保真度、可执行性与程序紧凑度。其复杂性分层与多样性采样设计揭示了模型在几何复杂度提升时性能显著下降、专用CAD模型在模态偏移下脆弱性突出、以及不同指标下模型排名不一致等关键学术问题，为可编辑三维重建研究指明了亟待突破的方向。

实际应用

在实际工程应用中，CADBench评估的能力可直接支撑逆向工程与自动化设计流程。例如，工程师可通过拍摄现有零件的照片或扫描其三维网格，借助经过该基准验证的模型快速生成可编辑的CAD程序，进而进行参数化修改、力学仿真或制造工艺规划。此外，该数据集还适用于工业设计中的快速原型迭代、旧有零件数字化重建、以及基于视觉输入的自适应夹具或工具设计，显著降低了对专业CAD建模技能依赖的同时，缩短了从实物观测到数字模型的工作周期。

数据集最近研究