five

ABC-Dataset

收藏
arXiv2019-04-30 更新2024-06-21 收录
下载链接:
https://deep-geometry.github.io/abc-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
ABC-Dataset是由柏林工业大学等机构创建的一个包含超过一百万个计算机辅助设计(CAD)模型的数据集,用于几何深度学习研究。该数据集中的每个模型都是由参数化曲线和曲面组成,提供了用于评估微分量、曲面分割、几何特征检测和形状重建的基准数据。数据集通过Onshape平台收集,支持不同格式和分辨率的数据生成,适用于广泛的几何学习算法比较。该数据集主要应用于表面法线估计、特征检测和形状重建等领域,旨在解决几何数据处理中的复杂问题。

The ABC-Dataset is a dataset containing over one million computer-aided design (CAD) models developed by institutions including the Technical University of Berlin for geometric deep learning research. Each model in this dataset is composed of parameterized curves and surfaces, providing benchmark data for evaluating differential quantities, surface segmentation, geometric feature detection, and shape reconstruction. The dataset is collected via the Onshape platform, supports data generation in various formats and resolutions, and is suitable for comparing a wide range of geometric learning algorithms. This dataset is primarily applied in fields such as surface normal estimation, feature detection, and shape reconstruction, aiming to solve complex problems in geometric data processing.
提供机构:
柏林工业大学
创建时间:
2018-12-15
搜集汇总
数据集介绍
main_image_url
构建方式
在几何深度学习领域,高质量三维模型的稀缺性制约了算法的进步。ABC-Dataset的构建依托于Onshape平台公开的计算机辅助设计模型库,通过为期四个月的自动化采集,汇集了超过一百万个独立CAD模型。每个模型均以边界表示形式存储,包含参数化曲面与曲线的显式描述,为后续处理提供了精确的几何基础。利用开源工具链,包括Open Cascade进行几何数据加载、Gmsh实现曲面网格化,以及定制化管线完成拓扑结构提取与质量过滤,确保了数据在保持高保真度的同时,支持多分辨率重采样与丰富的地面真值标注生成。
特点
该数据集的核心优势在于其独特的向量化表示与丰富的标注信息。与常见的点云或网格数据集不同,ABC-Dataset中的每个模型均以参数化边界表示存储,类似于图像中的矢量图形,允许在任意分辨率下无损重采样,并可直接解析计算微分几何量,如法向量与曲率,为算法评估提供了精确基准。数据集涵盖超过百万个人工创建的机械部件模型,包含多样化的曲面类型与尖锐特征,且通过结构化标注提供了面片分割、特征曲线及语义分解信息,使其能够支持从局部几何属性估计到全局形状重建的多种几何学习任务。
使用方法
研究者可通过数据集提供的开源处理管线,将CAD模型转换为适用于深度学习算法的离散表示,如点云或网格,并利用附带的标注信息进行监督学习。数据集支持构建大规模基准测试,例如表面法向量估计任务,用户可基于不同采样分辨率与面片规模生成训练与测试集,以公平比较数据驱动方法与传统几何算法的性能。此外,数据集还提供了渲染模块,可生成包含深度、轮廓等多模态图像数据,扩展至基于图像的几何学习任务。所有数据均以分块形式发布,并附有详细的元数据与使用指南,便于集成到现有研究流程中。
背景与挑战
背景概述
在几何深度学习的蓬勃发展中,高质量三维模型数据集的稀缺性成为制约算法进步的关键瓶颈。ABC-Dataset由柏林工业大学、斯科尔科沃科学技术学院及纽约大学的研究团队于2019年联合创建,旨在通过百万级计算机辅助设计模型构建标准化评估基准。该数据集以参数化曲线与曲面为核心表征形式,为微分几何量计算、曲面分块、特征检测等基础任务提供精确真值,其矢量化的数据特性支持多分辨率采样,为几何学习算法的公平比较奠定了坚实基础。作为机械设计领域规模最大的开放数据集,ABC-Dataset通过Onshape平台持续扩展的模型库,推动了三维几何分析从传统方法向数据驱动范式的转型。
当前挑战
该数据集致力于解决几何深度学习领域的三维形状分析难题,其核心挑战在于如何从非结构化的点云或网格数据中稳定提取微分几何特征。传统方法在复杂拓扑结构与噪声干扰下常出现估计偏差,而现有图神经网络在利用曲面连通性信息时效率显著低于解析方法,这揭示了深度学习架构在几何先验融合方面的理论局限。在构建过程中,研究团队面临原始CAD模型质量参差不齐的困境,包括边界破损、自相交面片等几何缺陷,需设计自动化过滤流水线处理海量数据。同时,参数化表征向离散格式的转换涉及复杂的几何采样与拓扑重建,如何保持微分属性精度与计算效率的平衡成为工程实现的关键难点。
常用场景
经典使用场景
在几何深度学习的蓬勃发展中,ABC-Dataset以其百万级计算机辅助设计模型成为评估和训练算法的关键资源。该数据集通过参数化曲面和曲线提供精确的微分属性、面片分割及特征检测的基准真值,使得研究人员能够在统一框架下对多种几何学习算法进行公平比较。例如,在表面法线估计任务中,ABC-Dataset被广泛用于构建大规模基准测试,验证数据驱动方法与传统几何处理算法的性能差异,从而推动几何深度学习在三维形状分析领域的进步。
实际应用
ABC-Dataset在工程设计与智能制造中展现出广泛的应用潜力。其包含的机械零件模型可直接用于计算机辅助设计软件的算法优化,如自动面片分解与特征提取,提升设计效率。在三维扫描与重建领域,数据集能够模拟真实扫描环境,评估点云上采样和形状重建技术的精度。同时,通过渲染模块生成的图像数据可支持基于视觉的检测系统开发,为工业质检与机器人导航提供高质量训练样本。
衍生相关工作
基于ABC-Dataset的丰富真值信息,多项经典研究工作得以深入开展。例如,在表面法线估计的基准测试中,研究者系统比较了PointNet++、DGCNN等七种深度学习算法与传统方法的性能,揭示了连接性信息在几何处理中的关键作用。此外,该数据集还促进了面片向量化、尖锐特征检测等方向的新方法探索,为后续研究如CSGNet等形状解析网络的开发提供了数据基础与评估标准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作