3D part assembly dataset
收藏arXiv2025-06-20 更新2025-06-24 收录
下载链接:
https://assembler3d.github.io
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含超过32万个高质量、多样化的对象组装的大型数据集,用于训练一个通用的组装模型。数据集的构建是通过一个基于现有3D形状数据集的分段和过滤流程实现的。数据集的内容包括各种不同的零件和物体组装,涵盖了不同的几何形状、零件数量和结构。该数据集旨在解决通用3D零件组装问题,支持生成各种复杂、真实世界的对象的组装。
This dataset is a large-scale collection of over 320,000 high-quality, diverse object assemblies, designed for training a general-purpose assembly model. It is constructed via a segmentation and filtering pipeline based on existing 3D shape datasets. The dataset encompasses a broad range of distinct part and object assemblies, spanning diverse geometric shapes, part counts, and structural configurations. This dataset aims to address the general 3D part assembly problem, supporting the generation of assemblies for various complex real-world objects.
提供机构:
中国腾讯公司ARC实验室
创建时间:
2025-06-20
搜集汇总
数据集介绍

构建方式
3D part assembly dataset的构建采用了创新的数据合成与筛选流程,通过利用现有大规模3D形状数据集中的非连接组件特性,研究者开发了一套高效的自动化处理管线。该流程包含四个关键步骤:基于语义标签的初始数据过滤、基于网格面片连通性的部件分割、基于KNN聚类算法的语义部件重组,以及随机刚体变换增强。特别值得注意的是,该方法创造性采用艺术家创作网格的天然部件分离特性,通过检测面片连通组件实现零错误分割,避免了传统分割算法的误差累积问题。最终从ObjaverseXL、ABO等七个主流数据源中整合出包含32万高质量装配样本的数据集,每个样本均包含精确的部件分割与多样化的初始位姿配置。
特点
该数据集的核心特征体现在其规模性、多样性与真实性三个维度。作为当前最大的3D部件装配数据集,其32万样本量远超同类数据集PartNet的1.7万规模。多样性方面覆盖了从日常物品到复杂机械的200+类别,单个对象的部件数量从3到100个呈动态分布,支持从简单家具到精密仪器的全谱系研究需求。真实性维度通过保留艺术家原创网格的精确几何特征,以及模拟真实装配场景的随机位姿初始化,确保了数据与工业应用场景的高度吻合。数据集特别强化了对对称部件、重复组件和多解装配情形等挑战性场景的覆盖,为生成式装配算法提供了丰富的学习素材。
使用方法
该数据集支持两种典型使用范式:生成式装配训练与结构化3D生成验证。在装配任务中,研究者可将分割部件及其初始位姿作为输入,以完整物体作为监督信号,训练扩散模型学习锚点云的生成过程。具体实现时建议采用论文提出的层次化训练策略,先以256锚点进行粗粒度预训练,再升级至1024锚点进行精细优化。对于结构化生成任务,可将数据集作为评估基准,通过部件重组质量、几何一致性等指标验证生成模型的组合推理能力。数据加载时需注意保持部件索引的对应关系,并利用提供的元数据实现动态锚点数量分配,以充分发挥数据集的规模化优势。
背景与挑战
背景概述
3D part assembly dataset是由腾讯ARC实验室、VAST和清华大学的研究团队于2025年提出的一个大规模三维部件装配数据集。该数据集旨在解决计算机视觉与图形学领域中的三维部件自动装配问题,即从一组模块化部件中重建完整的三维物体。数据集包含超过32万组多样化的部件-物体装配对,覆盖了广泛的日常物体类别,如家具、玩具、植物等。该数据集的构建基于对现有三维形状库(如PartNet、ObjaverseXL等)的合成与过滤流程,通过创新的形状中心表示和扩散模型技术,显著提升了三维部件装配的泛化能力和装配质量。这一工作为三维内容创作、计算机辅助设计(CAD)和机器人操作等领域提供了重要的数据支持和技术基础。
当前挑战
三维部件装配面临的核心挑战包括:1)领域问题的挑战:部件装配需要处理对称性、重复部件和多有效装配等固有歧义,传统确定性姿态预测方法难以有效捕捉这些复杂关系;2)数据构建的挑战:缺乏大规模、高质量的部件装配数据,现有数据集多局限于特定类别(如椅子、桌子)且部件数量有限。此外,部件几何形状的多样性、部件数量的变化以及结构复杂性,使得构建通用的装配模型极具挑战性。数据集的构建过程中还需解决三维模型分割的准确性、部件语义分组的合理性以及初始姿态模拟的真实性等问题。
常用场景
经典使用场景
3D part assembly dataset在计算机视觉与图形学领域被广泛应用于构建模块化物体的完整三维模型。该数据集通过提供大量多样化的零件-对象配对,支持从输入零件网格和参考图像重建完整物体的任务。其经典使用场景包括训练生成模型预测零件姿态,以及评估算法在对称零件、重复结构和多解装配情况下的性能。数据集特别适用于研究零件几何与语义理解、零件间关系推理及完整物体形状生成等核心问题。
实际应用
在实际应用层面,该数据集支撑了多个工业与创意领域的关键技术。在计算机辅助设计(CAD)领域,它赋能了自动化零件装配系统,显著提升建模效率。制造业中可用于优化产品模块化设计流程,而机器人领域则受益于其对物体结构关系的理解能力。特别值得注意的是基于该数据集开发的零件感知3D生成系统,能够从单张图像创建可编辑的高分辨率三维模型,为交互式设计提供了新的可能性。
衍生相关工作
该数据集催生了多个相关领域的经典工作。在生成模型方面,衍生出基于锚点扩散的零件装配框架Assembler,以及后续的Part123和PartGen等多视图重建方法。在表示学习领域,启发了Dora VAE等三维形状变分自编码器的开发。数据集还被用于验证DiffAssemble等图扩散模型在2D/3D重组任务中的有效性,并推动了HoloPart等全三维物体生成后分割方法的发展。这些工作共同推进了零件感知三维建模的技术边界。
以上内容由遇见数据集搜集并总结生成



