SYNBUILD-3D
收藏github2025-08-28 更新2025-09-02 收录
下载链接:
https://github.com/kdmayer/SYNBUILD-3D
下载链接
链接失效反馈官方服务:
资源简介:
SYNBUILD-3D是一个大规模、多模态、语义丰富的合成3D建筑模型数据集,包含超过620万个在细节层次4上语义丰富的3D建筑模型,包括相应的平面图图像和类似LiDAR的屋顶点云数据
SYNBUILD-3D is a large-scale, multimodal, semantically-rich synthetic 3D building model dataset. It contains over 6.2 million semantically-rich 3D building models at Level of Detail 4 (LOD4), along with corresponding floor plan images and LiDAR-like rooftop point cloud data.
创建时间:
2025-08-28
原始信息汇总
SYNBUILD-3D 数据集概述
数据集简介
SYNBUILD-3D 是一个大规模、多模态、语义丰富的合成3D建筑模型数据集,包含超过620万个语义增强的Level of Detail 4级别3D建筑模型,以及相应的平面图图像和类似LiDAR的屋顶点云数据。
数据内容
- 完整数据集:包含8个.tar文件(prod_run_X_2000.tar.gz)
- 样本数据集:包含100个随机抽样的3D建筑及其平面图和分割掩码(sample_100.zip)
数据组织方式
Synbuild-3D-NeurIPS-Release/ ├── data/ │ └── prod_run_X_2000/ # 从prod_run_X_2000.tar.gz提取 │ └── sample_100/ # 从sample_100.zip提取
获取方式
数据集可从斯坦福研究数据(SDR)获取:
- 下载地址:https://purl.stanford.edu/kz908vb7844
可视化工具
提供Jupyter notebook可视化工具:
dataset_visualization.ipynb- 用于3D可视化
环境要求
- Python 3.11
- 依赖包详见requirements.txt
引用信息
bibtex @dataset{synbuild3d, title = {SYNBUILD-3D: A large, multi-modal, and semantically rich synthetic dataset of 3D building models at Level of Detail 4}, author = {Mayer, Kevin and Vesel, Alex and Zhao, Xinyi and Fischer, Martin}, year = {2025}, publisher = {Stanford Research Data}, doi = {https://doi.org/10.25740/kz908vb7844}, url = {https://purl.stanford.edu/kz908vb7844} }
搜集汇总
数据集介绍

构建方式
在建筑信息建模与三维重建领域,SYNBUILD-3D数据集通过高度自动化的合成生成流程构建而成。该流程整合了语义建模与多模态数据融合技术,系统性地生成了超过620万个符合Level of Detail 4标准的建筑模型。每个模型不仅包含精细的三维几何结构,还同步生成了对应的平面图图像与模拟LiDAR的屋顶点云数据,形成了完整且一致的多模态表达。
特点
作为当前规模最大、语义信息最丰富的合成建筑数据集之一,SYNBUILD-3D具备多模态、高精度与强语义三大特征。数据集提供建筑组成部分的详细语义标注,涵盖墙体、门窗、屋顶等结构要素,同时包含二维平面图与三维点云的配对数据。其合成数据具有真实物理属性,支持从计算机视觉到建筑数字化等多领域研究需求,为算法训练与验证提供了丰富而可靠的基准。
使用方法
研究者可通过斯坦福研究数据平台获取数据集压缩包,解压后按指定目录结构组织数据文件。使用前需配置Python 3.11环境并安装依赖库,通过Jupyter Notebook运行可视化工具即可交互式浏览三维模型与多模态数据。数据集支持批量读取与程序化处理,适用于深度学习模型训练、三维重建算法评估以及建筑信息提取等研究场景,具体实现可参考提供的示例代码与可视化案例。
背景与挑战
背景概述
三维建筑建模领域长期面临真实数据稀缺与语义信息不足的瓶颈,SYNBUILD-3D数据集由斯坦福大学Kevin Mayer等研究者于2025年发布,旨在提供大规模、多模态且语义丰富的三维建筑模型资源。该数据集包含超过620万个细节等级4(LoD4)的建筑模型,融合了平面图图像与激光雷达式屋顶点云数据,为数字孪生、城市规划与建筑信息模型(BIM)研究提供了关键基础设施,显著推动了三维语义理解与生成模型的发展。
当前挑战
在建筑三维建模领域,SYNBUILD-3D需解决多模态数据对齐与语义一致性难题,包括几何结构重建的精度约束、点云与图像数据的跨模态融合,以及大规模合成数据的真实性验证。数据集构建过程中面临生成管道的复杂性挑战,涉及数百万模型的结构化生成、语义标注的自动化处理,以及数据存储与分发的计算资源优化,这些挑战共同体现了高精度三维合成数据生产的工程技术壁垒。
常用场景
经典使用场景
在建筑信息建模与数字孪生领域,SYNBUILD-3D数据集为三维建筑物语义分割研究提供了重要支撑。其超过620万个LOD4级别建筑模型包含精细的语义标注、平面图图像及激光雷达式屋顶点云数据,成为训练深度神经网络进行建筑物组件自动识别的基准资源。研究者通过该数据集能够有效验证三维几何学习算法在复杂建筑结构解析中的性能表现。
解决学术问题
该数据集显著解决了三维建筑模型缺乏大规模高质量标注数据的学术困境。通过提供统一格式的多模态建筑数据,支持了建筑几何生成、语义分割算法评估、点云处理技术验证等核心研究方向。其丰富的语义层级结构为建筑信息科学领域建立了新的评估基准,推动了三维深度学习模型在建筑数字化中的应用边界拓展。
衍生相关工作
基于SYNBUILD-3D数据集已衍生出多项创新研究,包括基于Transformer的建筑部件识别框架、多模态建筑生成对抗网络等。这些工作显著提升了建筑几何处理的自动化程度,其中部分成果已应用于历史建筑数字化保护项目,推动了建筑遗产的高精度三维重建技术发展。
以上内容由遇见数据集搜集并总结生成



