Cluster3D
收藏github2021-11-24 更新2024-05-31 收录
下载链接:
https://github.com/cluster3d/cluster3d.github.io
下载链接
链接失效反馈官方服务:
资源简介:
我们介绍了首个大规模的非分类3D CAD模型聚类数据集和基准。我们使用ABC数据集的几何数据,并开发了一个界面,使专家机械工程师能够高效地标注成对的CAD模型相似性,用于评估七种基线深度聚类方法的性能。我们的数据集包含一个手动标注的子集,包含22,968个形状和252,648个标注。这是首个直接针对几何形状深度聚类算法的数据集,我们相信它将成为分析和利用开始出现在深度几何计算中的大规模3D形状集合的重要构建块。我们的结果表明,与已经成熟的形状分类算法不同,3D CAD模型的深度聚类算法仍处于初期阶段,有很大的改进空间。
We introduce the first large-scale non-classification 3D CAD model clustering dataset and benchmark. Utilizing geometric data from the ABC dataset, we developed an interface that allows expert mechanical engineers to efficiently annotate pairwise CAD model similarities for evaluating the performance of seven baseline deep clustering methods. Our dataset includes a manually annotated subset comprising 22,968 shapes and 252,648 annotations. This is the first dataset directly targeting deep clustering algorithms for geometric shapes, and we believe it will serve as a crucial building block for analyzing and leveraging large-scale 3D shape collections emerging in deep geometric computing. Our results indicate that, unlike the well-established shape classification algorithms, deep clustering algorithms for 3D CAD models are still in their infancy, with significant room for improvement.
创建时间:
2021-06-06
原始信息汇总
Cluster3D 数据集概述
数据集介绍
Cluster3D 是一个针对非类别性3D CAD模型的大规模数据集和基准,用于非类别性标注和聚类。该数据集利用了ABC数据集的几何数据,并通过开发一个界面,使专业机械工程师能够高效地标注成对的CAD模型相似性。
数据集内容
- 模型数量:包含22,968个形状的手动标注子集。
- 标注数量:共有252,648个标注。
- 文件组成:
similarity-#.npz:包含数据集的标注矩阵,共有三个文件,每个文件对应一个标注者。obj.csv:用于关联similarity.npz矩阵中的行或列与对象ID。group.csv:包含用于标注的初始对象ID组。data.json:包含标注信息,similarities字段显示标注者认为每个组共享的相同特征,cluster ID字段对应于group.csv。
数据集用途
该数据集旨在直接针对几何形状的深度聚类算法,被认为是分析和利用大规模3D形状集合的重要构建块,尤其是在深度几何计算领域。
搜集汇总
数据集介绍

构建方式
Cluster3D数据集的构建基于ABC数据集的几何数据,通过开发一个高效的标注界面,邀请机械工程领域的专家对成对的CAD模型相似性进行标注。这一过程生成了包含22,968个形状和252,648个标注的手动标注子集,旨在为三维CAD模型的非分类标注和聚类提供首个大规模数据集和基准。
特点
Cluster3D数据集的特点在于其专注于三维几何形状的深度聚类算法,提供了丰富的标注数据,包括三个不同的标注者生成的相似性矩阵。这些标注数据通过.npz文件格式存储,每个文件对应一个标注者的标注矩阵,同时提供了obj.csv和group.csv文件,分别用于对象ID的映射和初始组的标注,以及data.json文件包含详细的标注信息。
使用方法
使用Cluster3D数据集时,用户可以通过提供的Google Drive链接下载数据集。数据集包含多个文件,用户需根据obj.csv文件中的对象ID与相似性矩阵中的行或列对应,利用group.csv文件中的初始组信息进行标注分析。data.json文件中的相似性字段和聚类ID字段为用户提供了详细的标注和聚类信息,支持用户进行深度聚类算法的性能评估和改进研究。
背景与挑战
背景概述
Cluster3D数据集是首个专注于非分类3D CAD模型聚类的大规模数据集与基准测试平台。该数据集由机械工程领域的专家团队开发,旨在解决3D几何形状的深度聚类问题。数据集基于ABC数据集的几何数据,通过专家标注的22,968个形状和252,648条相似性注释,为深度聚类算法的性能评估提供了重要支持。Cluster3D的推出标志着3D几何计算领域对大规模形状集合分析与利用的需求日益增长,同时也揭示了当前深度聚类算法在3D CAD模型处理中的不成熟性。该数据集为相关研究提供了重要的基础资源,推动了3D几何计算与机械设计领域的交叉发展。
当前挑战
Cluster3D数据集面临的挑战主要体现在两个方面。其一,3D CAD模型的非分类聚类问题本身具有高度复杂性,几何形状的多样性与相似性判断的主观性为算法的设计与评估带来了显著困难。其二,数据集的构建过程中,专家标注的效率和一致性是关键挑战。由于3D形状的相似性判断依赖于领域知识,标注过程耗时且易受主观因素影响。此外,如何将标注结果有效转化为算法可用的结构化数据,并确保其适用于多种深度聚类方法的评估,也是数据集构建中的技术难点。这些挑战共同推动了3D几何计算领域对更高效、更鲁棒的聚类算法的需求。
常用场景
经典使用场景
Cluster3D数据集专为3D CAD模型的非分类标注和聚类设计,广泛应用于机械工程和计算机图形学领域。该数据集通过提供大量手动标注的3D形状数据,支持研究人员开发和测试深度聚类算法,特别是在处理几何形状的相似性分析方面。
解决学术问题
Cluster3D数据集解决了3D CAD模型在非分类标注和聚类方面的研究空白。通过提供详细的几何数据和专家标注的相似性矩阵,该数据集为开发更高效的深度聚类算法提供了基础,推动了3D形状分析技术的发展,尤其是在处理大规模3D形状集合时。
衍生相关工作
Cluster3D数据集的发布激发了多项相关研究,特别是在深度学习和3D几何计算领域。基于该数据集,研究人员开发了多种新的聚类算法,并提出了改进的3D形状分析方法。这些工作不仅推动了学术研究的进展,也为工业应用提供了新的技术解决方案。
以上内容由遇见数据集搜集并总结生成



