five

SYNBUILD-3D

收藏
arXiv2025-08-29 更新2025-09-03 收录
下载链接:
https://purl.stanford.edu/kz908vb7844
下载链接
链接失效反馈
官方服务:
资源简介:
SYNBUILD-3D 是一个大规模的、多样化的、多模态的合成数据集,包含了超过 620 万个合成 3D 住宅建筑,每个建筑都被标注了详细的房间、门和窗户的几何形状,共提供了超过 3.9 亿个标签。该数据集的特点在于其统一的结构,提供了集成的室内外线框,并具有一致的几何和语义,为生成 3D 建筑模型提供了新的可能性。数据集包括语义丰富的 3D 线框、屋顶点云和带有分割掩码的平面图图像,支持跨模态的生成任务。该数据集的创建旨在促进 3D 建筑模型的生成,特别是针对 LoD 4 级别的建筑模型,为建筑学、能源模拟和导航等领域提供了丰富的数据资源。

SYNBUILD-3D is a large-scale, diverse, and multimodal synthetic dataset containing over 6.2 million synthetic 3D residential buildings. Each building is annotated with detailed geometric shapes of rooms, doors and windows, with a total of more than 390 million labels provided. The dataset features a unified structure that integrates indoor and outdoor wireframes, and maintains consistent geometric and semantic attributes, unlocking new possibilities for 3D architectural model generation. It encompasses semantically rich 3D wireframes, roof point clouds, and floor plan images with segmentation masks, supporting cross-modal generation tasks. This dataset was developed to facilitate the generation of 3D architectural models, especially those at the LoD 4 level, providing abundant data resources for fields including architecture, energy simulation and navigation.
提供机构:
斯坦福大学土木与环境工程系, 斯坦福大学计算机科学系
创建时间:
2025-08-29
原始信息汇总

SYNBUILD-3D: A large, multi-modal, and semantically rich synthetic dataset of 3D building models at Level of Detail 4

摘要

SYNBUILD-3D是一个大规模、多样化、多模态的合成数据集,包含超过620万个Level of Detail(LOD)4级别的住宅建筑3D模型。该数据集通过三种不同模态表示每个建筑:LOD 4级别的语义增强3D线框图(模态I)、相应的平面图图像(模态II)以及从相应屋顶表面采样的类似LiDAR的点云(模态III)。每个建筑线框的语义注释源自相应的平面图图像,包含房间、门和窗户的信息。

资源类型

  • 数据集
  • 三维对象
  • 静态图像

发布日期

  • 2025年8月27日

创作者/贡献者

  • 作者:Mayer, Kevin(ORCID:https://orcid.org/0000-0002-5340-2711)
  • 贡献者:Vesel, Alex
  • 贡献者:Zhao, Xinyi
  • 学位委员会成员:Fischer, Martin(ORCID:https://orcid.org/0000-0002-5071-017X)

主题

  • Level of Detail(LOD)4
  • 3D建筑模型
  • 数据集
  • 多模态

类型

  • 数据
  • 3D模型
  • 图像
  • 数据集
  • 三维扫描

书目信息

  • DOI:https://doi.org/10.25740/kz908vb7844
  • 位置:https://purl.stanford.edu/kz908vb7844

访问条件

  • 使用和复制:用户同意在适用情况下,内容不会用于识别或以其他方式侵犯个人的隐私或保密权利。通过斯坦福数字存储库分发的内容可能受到存储者应用的其他许可和使用限制。
  • 许可:本作品采用知识共享署名4.0国际许可协议(CC BY)进行许可。

首选引用

@dataset{mayer2025synbuild3d, title = {SYNBUILD-3D: A large, multi-modal, and semantically rich synthetic dataset of 3D building models at Level of Detail 4}, author = {Mayer, Kevin and Vesel, Alex and Zhao, Xinyi and Fischer, Martin}, year = {2025}, publisher = {Stanford Research Data}, doi = {https://doi.org/10.25740/kz908vb7844}, url = {https://purl.stanford.edu/kz908vb7844} }

所属集合

  • 斯坦福研究数据

版本

  • 版本1:2025年8月27日(当前查看版本)

联系信息

  • 联系人:kdmayer@stanford.edu

使用指标

  • 查看次数:39
  • 下载次数:11
搜集汇总
数据集介绍
main_image_url
构建方式
在建筑信息建模领域,SYNBUILD-3D通过多阶段流程构建,首先利用改进的程序生成引擎随机化建筑外部结构,涵盖多种屋顶类型和楼层数;随后基于提取的楼层平面轮廓,采用AI驱动的平面图生成器产生带语义分割掩码的布局图像;继而通过定制化矢量算法处理非曼哈顿几何结构,提取房间、门窗的几何与语义信息;最终通过优化对齐与堆叠流程,将矢量化的楼层单元精确集成至三维建筑外壳中,形成统一的内外一体化线框模型。
特点
该数据集以Level of Detail 4为标准,涵盖超过620万住宅建筑,提供三重模态数据:语义增强的三维线框图、对应平面图像及类LiDAR屋顶点云。其核心特点包括高度语义丰富性,包含房间、门窗的详细几何标注,总数超3.9亿标签;结构上支持多层复杂布局与非正交几何,突破现有数据集仅关注外部的限制;多模态设计支持跨模态条件生成任务,且通过自动化质量检查确保拓扑一致性与功能合理性,为生成式算法提供语义-几何一致性约束的基准。
使用方法
研究人员可通过公开访问的数据集链接获取分包的压缩文件,主要目录包含JSON格式的三维线框文件,其中集成点坐标、邻接矩阵及语义映射。使用时可解析final_building_points与final_building_adj构建拓扑图,结合floorplan_ID_list关联平面图像与分割掩码;屋顶点云数据支持LiDAR模拟任务,而unit_dict_list提供分层单元细节。该数据集适用于训练生成模型,如基于平面布局或屋顶几何的条件生成,同时支持建筑模拟、室内导航及能量分析等应用,代码库提供可视化工具与生成流程文档。
背景与挑战
背景概述
三维建筑模型在建筑学、能源模拟和导航等领域具有关键应用价值,但长期以来缺乏大规模、高细节且语义丰富的公开数据集。斯坦福大学研究团队于2025年推出了SYNBUILD-3D数据集,该数据集包含620万个细节等级(LoD 4)的合成住宅建筑模型,每个模型均配备三维线框、平面图图像和屋顶点云三种模态数据,并标注了房间、门窗等语义信息。这一成果填补了高细节级别建筑数据集的空白,为生成式人工智能算法在建筑几何与语义一致性建模方面的研究提供了重要基础。
当前挑战
在领域问题层面,SYNBUILD-3D旨在解决LoD 4级别建筑模型的自动化生成难题,其核心挑战在于如何实现多模态数据(线框、点云、平面图)之间的语义-几何一致性约束,以及如何建模非曼哈顿结构的复杂建筑布局。在构建过程中,研究团队需攻克非矩形足迹的程序化生成、基于条件生成对抗网络的平面图合成、非正交几何的向量化算法设计,以及跨楼层语义标注的统一性维护等技术瓶颈。
常用场景
经典使用场景
在建筑信息建模与城市数字化领域,SYNBUILD-3D数据集通过其多模态特性为三维建筑生成模型提供了关键支撑。该数据集最经典的应用场景是训练生成式人工智能算法,以自动化创建具有语义一致性的LoD 4级别建筑模型,涵盖从平面图到屋顶点云的多维度条件生成任务。
衍生相关工作
SYNBUILD-3D催生了多项经典研究工作,包括基于条件生成对抗网络的建筑布局生成算法、多模态数据融合的屋顶重建方法,以及非曼哈顿几何的矢量化处理技术。这些工作扩展了其在生成式建模、几何优化和语义分割等方向的应用边界。
数据集最近研究
最新研究方向
在建筑信息模型与数字孪生技术蓬勃发展的背景下,SYNBUILD-3D数据集正推动三维建筑生成领域向多模态融合与语义一致性建模方向突破。该数据集通过整合620万栋LoD4级别建筑的线框模型、平面图图像与屋顶点云数据,为生成式人工智能提供了跨模态条件生成的研究基础,特别是在基于平面图布局与屋顶几何约束的自动化建筑建模领域。其语义标注体系涵盖房间功能分区与门窗结构,显著提升了生成模型在几何精确性与语义合理性方面的表现,为智慧城市、能源仿真与室内导航等应用提供了高质量数据支撑。
相关研究论文
  • 1
    SYNBUILD-3D: A large, multi-modal, and semantically rich synthetic dataset of 3D building models at Level of Detail 4斯坦福大学土木与环境工程系, 斯坦福大学计算机科学系 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作