five

CADReview

收藏
arXiv2025-05-28 更新2025-05-30 收录
下载链接:
https://cgl-pro.github.io/cadreview
下载链接
链接失效反馈
官方服务:
资源简介:
CADReview数据集是一个用于计算机辅助设计(CAD)审查任务的新基准数据集,包含超过20K个程序-图像对,具有多样化的错误。数据集包括由经验丰富的设计师创建的人造程序和从简单几何基元生成的机器制造程序,以及每个程序对应的参考图像。数据集包含8种与实际CAD审查应用相关的错误场景,如基元错误、旋转错误、位置错误、尺寸错误、常量错误、逻辑错误、缺失块和冗余块。该数据集旨在帮助研究人员和开发者训练和评估能够自动检测和纠正CAD程序错误的模型,从而提高设计效率并减少设计错误。

The CADReview dataset is a novel benchmark dataset for computer-aided design (CAD) review tasks, comprising over 20,000 program-image pairs with diverse errors. The dataset includes human-made programs created by experienced designers and machine-generated programs derived from simple geometric primitives, along with corresponding reference images for each program. It covers 8 types of error scenarios relevant to real-world CAD review applications, namely primitive errors, rotation errors, position errors, dimension errors, constant errors, logical errors, missing blocks, and redundant blocks. This dataset is designed to help researchers and developers train and evaluate models capable of automatically detecting and correcting errors in CAD programs, so as to enhance design efficiency and reduce design mistakes.
提供机构:
华南理工大学软件学院, 教育部大数据与智能机器人重点实验室, 香港理工大学
创建时间:
2025-05-28
原始信息汇总

CADReview 数据集概述

基本信息

  • 数据集名称: CADReview
  • 论文会议: ACL Main Conference 2025
  • 作者单位:
    • 华南理工大学 (South China University of Technology)
    • 香港理工大学 (The Hong Kong Polytechnic University)
  • 论文链接: arXiv | 代码链接: Code

数据集简介

  • 目的: 支持CAD程序自动审查任务,通过参考图像检测和纠正CAD程序中的错误。
  • 规模: 包含超过20K程序-图像对。
  • 特点:
    • 包含人类制作和机器生成的CAD程序。
    • 多样化的3D对象结构。
    • 包含八种不同的错误类型(如逻辑、原始、位置、常量等)。

数据集特性

  • 组件级推理: 3D对象由多个几何组件组成,每个组件映射到特定的代码块。
  • 内部结构分析: 部分错误发生在视觉隐藏的内部组件中,需要程序分析。
  • 精确代码转换: 纠正错误需要几何推理和空间转换(如平移、旋转)。
  • 多视角参考图像: 每个样本配有三种不同视角的渲染设计图。

错误类型

  • 逻辑错误
  • 原始错误
  • 位置错误
  • 常量错误
  • 其他四种未明确命名的错误类型

标注流程

  1. 收集程序-图像对
  2. 在CAD程序中创建错误
  3. 对CAD程序进行反馈标注

ReCAD框架

  • 反馈生成器: 对齐3D对象的几何组件与代码块,生成错误反馈。
  • 代码编辑器: 根据反馈进行程序级几何转换以纠正错误。
  • 关键技术:
    • 几何组件识别 (GCR)
    • 空间几何操作 (SGO)

实验结果

  • ReCAD在CADReview数据集上显著优于现有MLLMs。
  • 在CAD代码与视觉组件对齐及高质量纠正方面表现优异。

引用

bibtex @article{chen2025cadreview, title={CADReview: Automatically Reviewing CAD Programs with Error Detection and Correction}, author={Jiali Chen, Xusen Hei, HongFei Liu, Yuancheng Wei, Zikun Deng, Jiayuan Xie, Yi Cai, Li Qing}, year={2025} }

搜集汇总
数据集介绍
main_image_url
构建方式
CADReview数据集的构建过程充分考虑了计算机辅助设计(CAD)领域的实际需求,通过精心设计的流程收集了超过20K的程序-图像对。数据来源包括经验丰富的设计师创建的人工程序和基于简单几何基元生成的机器程序,确保了数据在几何复杂性和程序结构上的多样性。数据集构建采用了多视角渲染技术获取参考图像,并开发了专门的图形标注界面用于人工错误标注。此外,利用GPT-4o进行反馈标注,并通过人工校验确保反馈质量,最终形成了包含8种常见错误类型的综合性数据集。
使用方法
CADReview数据集主要用于训练和评估CAD程序自动审查系统。使用时,研究者可以将参考图像和潜在错误的CAD程序输入模型,要求模型完成两项任务:错误检测和程序修正。数据集的标准评估流程包括反馈生成质量评估(使用ROUGE-L、BERTScore等指标)和程序修正效果评估(通过计算编辑后3D对象与参考对象之间的倒角距离等几何指标)。为充分发挥数据集价值,建议采用多阶段训练策略:先在CAD描述和定位任务上预训练,再在CADReview上进行微调。数据集已划分为训练集、验证集和测试集,确保评估结果的可靠性。
背景与挑战
背景概述
CADReview数据集由华南理工大学与香港理工大学的研究团队于2025年提出,旨在解决计算机辅助设计(CAD)领域程序自动审查的关键问题。该数据集包含超过20,000组程序-图像对,覆盖了8类常见设计错误,如几何基元错误、位置偏差和逻辑缺陷等。作为首个专注于CAD程序错误检测与修正的基准数据集,CADReview通过融合多模态数据(参考图像、CAD程序及渲染结果),推动了设计自动化领域从生成到质量验证的研究范式转变。其创新性地将传统设计流程中的人工审查转化为可计算的视觉-程序对齐任务,为AI辅助工业设计提供了新的技术路径。
当前挑战
CADReview面临的核心挑战体现在两个维度:在领域问题层面,现有多模态大语言模型难以准确识别CAD程序中嵌套的几何组件(如隐藏内部结构)及其空间关系,导致错误检测准确率不足40%;在构建层面,数据采集需平衡真实设计场景的复杂性(如控制流嵌套)与标注可行性,而错误注入过程要求保持程序语法合法性。此外,反馈标注需同时满足视觉异常描述、错误代码定位和修正建议生成的三重一致性,这对标注者的CAD专业知识和跨模态理解能力提出了极高要求。
常用场景
经典使用场景
CADReview数据集在计算机辅助设计(CAD)领域具有广泛的应用价值。该数据集主要用于自动检测和修正CAD程序中的错误,确保3D对象与参考图像的一致性。通过提供超过20K的程序-图像对,CADReview为研究人员和工程师提供了一个标准化的基准,用于评估和改进CAD程序的质量。其经典使用场景包括设计流程中的自动化审查、3D模型生成与修正,以及多模态大语言模型(MLLMs)在CAD领域的性能测试。
解决学术问题
CADReview数据集解决了CAD程序自动审查中的多个关键学术问题。首先,它填补了现有数据集在错误检测和修正方面的空白,为研究人员提供了一个包含多样化错误类型的数据集。其次,该数据集通过引入多模态对齐机制,解决了MLLMs在识别几何组件和空间几何操作上的局限性。此外,CADReview还推动了CAD程序自动生成与修正领域的研究,为设计流程的自动化和智能化提供了重要支持。
实际应用
在实际应用中,CADReview数据集为工业设计和制造领域提供了高效的工具。设计师可以利用该数据集训练模型,自动检测和修正CAD程序中的错误,从而减少人工审查的时间和成本。此外,该数据集还可用于优化3D建模软件的性能,提升设计流程的效率和准确性。在教育和培训领域,CADReview可作为教学资源,帮助学生和初学者理解CAD程序的结构和错误修正方法。
数据集最近研究
最新研究方向
CADReview数据集作为计算机辅助设计(CAD)领域的重要资源,近期研究聚焦于利用多模态大语言模型(MLLMs)自动检测和修正CAD程序中的错误。该数据集包含超过20K程序-图像对,覆盖多种错误类型,如几何原语错误、旋转错误、位置错误等。前沿研究方向包括开发新型框架如ReCAD,通过反馈生成器和代码编辑器实现错误检测与修正,显著提升了设计流程的自动化水平。这一进展对工业设计和智能制造具有重要意义,能够大幅减少设计师的重复劳动,提高设计效率与准确性。
相关研究论文
  • 1
    CADReview: Automatically Reviewing CAD Programs with Error Detection and Correction华南理工大学软件学院, 教育部大数据与智能机器人重点实验室, 香港理工大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作