five

GNI BIM Dataset

收藏
github2026-04-27 更新2026-04-28 收录
下载链接:
https://github.com/ZijianWang-ZW/GNI-BIM-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
来自TUM Georg Nemetschek Institute (GNI)的224个匿名化IFC建筑模型数据集,包括208个单学科学生提交的模型和16个来自9个多学科设计项目的模型。数据集还包含匿名化脚本和一个指向其他在线IFC模型资源的CSV文件。

A dataset of 224 anonymized IFC building models from the TUM Georg Nemetschek Institute (GNI), which includes 208 single-disciplinary student-submitted models and 16 models from 9 multidisciplinary design projects. The dataset also contains anonymization scripts and a CSV file pointing to other online IFC model resources.
创建时间:
2026-04-23
原始信息汇总

GNI BIM Dataset 数据集概述

基本信息

GNI BIM Dataset 由慕尼黑工业大学(TUM)Georg Nemetschek Institute(GNI)发布,包含 224 个匿名化的 IFC 建筑模型,分为两部分:

  • 208 个单学科学生提交的模型
  • 16 个来自 9 个多学科设计项目的模型

数据集还提供了匿名化脚本和一个包含其他在线 IFC 模型资源链接的 CSV 文件。

数据集构成

1. 模型文件

  • IFC-models/2025_BIMfundamentals/ — 208 个单学科 IFC 模型,来自 BIM 基础 硕士课程(WS 2024/25),为特定形状建筑的独立作业。
  • IFC-models/2026_BIMprojects/ — 16 个 IFC 模型,来自 BIM 项目 硕士课程(WS 2025/26);9 个团队中,7 个团队提供了同一建筑的成对建筑和结构模型。

2. 代码与资源

  • code/ — 匿名化脚本。
  • other_online_BIM_model_resources.csv — 35 个其他在线 BIM 来源。

3. 工具

数据集同时开源了 IFC2StructuredData 工具,用于提取 BIM 对象属性(CSV 格式)和几何数据(OBJ 格式)。

数据收集

两个子集均来自 TUM Georg Nemetschek Institute 的学生课程作业:

  • BIM 基础(硕士课程) — 每位学生使用商业 BIM 工具构建中小型模型的个人作业。
  • BIM 项目(硕士课程) — 学期团队作业,为同一建筑生成建筑和结构模型。

所有模型在作者同意下,以 Creative Commons Attribution 4.0 International License (CC BY 4.0) 发布。

匿名化处理

code/ 中的脚本从每个 IFC 文件中移除了识别信息,包括:

  • STEP 文件头
  • IfcPersonIfcOrganizationIfcPostalAddressIfcTelecomAddress
  • IfcApplication 开发者
  • IfcProjectIfcBuilding
  • 德国学生表单属性(如 Verfasser *Projektnummer 等)

发布的文件仅包含占位元数据。

数据集统计

子集 文件数 是否成对? 使用的模式
2025_BIMfundamentals 208 IFC2x3, IFC4
2026_BIMprojects 16(9 个项目) 9 个中有 7 个成对 IFC2x3, IFC4

解析结果(共解析 223 个模型,1 个 536 MB 的建筑文件因无法加载被跳过):

  • 观察到 42 种 IfcElement 子类(包括墙、门、窗、梁、柱、板、构件、板片、家具、钢筋等物理建筑构件)。
  • 总共 290,877 个元素实例
  • 大多数实例为结构框架(IfcMemberIfcPlate)以及开口或代理组件,少数为 MEP、家具和组装实体。

许可与免责声明

  • 数据集内容采用 CC BY 4.0 许可。
  • code/ 中的匿名化脚本采用 MIT 许可
  • 模型来源于学生课程作业,按“原样”提供,不保证正确性、完整性或特定用途的适用性。作者和 TUM 不对建模内容(包括原始 BIM 工具嵌入的任何第三方产品族)负责,也不声明几何或语义符合任何工程标准。

引用

请使用以下 BibTeX 条目引用本数据集:

bibtex @misc{wang2026gnibim, title = {{GNI BIM} Dataset}, author = {Wang, Zijian and Fuchs, Stefan and Wu, Jiabin and Esser, Sebastian and Wrabel, Tamira and Borrmann, Andre}, year = {2026}, howpublished = {Technical University of Munich, Georg Nemetschek Institute (GNI)}, doi = {https://doi.org/10.5281/zenodo.19722012}, url = {url{https://github.com/ZijianWang-ZW/GNI-BIM-Dataset}} }

数据集下载

搜集汇总
数据集介绍
main_image_url
构建方式
建筑信息模型(BIM)作为现代建筑行业数字化转型的核心技术,其数据集的构建对于推动相关研究至关重要。GNI BIM数据集源自慕尼黑工业大学Georg Nemetschek研究所(GNI)的学生课程作业,涵盖208份来自《BIM基础》硕士课程的单学科模型,以及16份来自《BIM项目》硕士课程的团队作品(含9个设计项目,其中7组提供了同一建筑的建筑与结构配对模型)。所有模型均以IFC格式呈现,并在征得作者同意后以CC BY 4.0许可发布。为保护隐私,数据集提供了匿名化脚本,用于删除IFC文件中的STEP头信息、个人与组织实体、联系方式及德国学生私有属性等标识性数据,仅保留占位符元数据。
特点
该数据集具有鲜明特色:其一,规模适中但结构丰富,包含42个IfcElement子类(如墙、门、窗、梁、柱、板、钢筋等)的共计290,877个构件实例,横跨IFC2x3与IFC4两种标准模式;其二,来源多样,既有面向单一建筑的个体作业,也有反映真实协作流程的配对多学科模型,增强了数据的代表性;其三,附带了IFC2StructuredData开源解析工具,可将IFC文件中的BIM对象属性提取为CSV格式,几何信息提取为OBJ格式,极大便利了后续分析与应用。此外,数据集还收录了35个其他在线BIM资源链接,为研究者提供了更广阔的参考网络。
使用方法
使用者可通过Zenodo DOI链接(10.5281/zenodo.19722011)直接下载数据集,其中IFC模型文件按课程分别存放于`IFC-models/2025_BIMfundamentals/`与`IFC-models/2026_BIMprojects/`两个子目录。为进一步自动化处理,推荐采用附带的IFC2StructuredData工具进行批量解析,将其转换为结构化的CSV属性表与OBJ几何文件,以便融入机器学习或数据统计分析流程。匿名化脚本位于`code/`文件夹下,用户可依据自身需求对新增IFC文件进行隐私清理。所有公开模型均按原样提供,不保证符合任何工程标准,使用者需自行验证其适用性。
背景与挑战
背景概述
建筑信息模型(BIM)技术作为现代建筑行业数字化转型的核心,其标准化数据交换格式IFC(Industry Foundation Classes)的广泛应用催生了对高质量、大规模IFC数据集的迫切需求。2026年,由慕尼黑工业大学Georg Nemetschek研究所(GNI)的Wang Zijian、Fuchs Stefan等研究人员创建的GNI BIM Dataset应运而生,该数据集汇集了224个经过匿名化处理的IFC建筑模型,其中包含208个来自BIM Fundamentals硕士课程(WS 2024/25)的单人学生作业,以及16个来自BIM Project硕士课程(WS 2025/26)的9个团队设计项目。数据集以CC BY 4.0许可发布,旨在支持BIM数据解析、结构分析、模型质量评估等研究领域,其发布成为推动BIM数据科学研究的重要里程碑。
当前挑战
该数据集所解决的领域问题聚焦于BIM数据标准化与互操作性,核心挑战包括:1)IFC数据多样性带来的解析困难——数据集横跨IFC2x3与IFC4两个版本,且涵盖42种IfcElement子类,共计290,877个元素实例,不同建模工具导出的数据质量与语义一致性参差不齐;2)模型正确性与完整性缺失——由于数据源自学生课程作业,无法保证几何与语义符合工程标准,部分模型可能存在结构冲突或属性缺失。构建过程中面临的主要挑战是隐私保护与数据脱敏,需编写脚本移除IFC文件中的STEP头部、IfcPerson、IfcOrganization等标识信息,确保所有模型仅保留占位元数据,同时一个536MB的大型建筑文件因计算资源限制无法解析,反映出处理异构大规模BIM数据的技术瓶颈。
常用场景
经典使用场景
在建筑信息模型(BIM)研究领域,GNI BIM Dataset为算法验证与模型分析提供了标准化的基准评测平台。该数据集包含224个匿名的IFC建筑模型,涵盖208个单学科学生作品和16个多学科协同设计项目,覆盖IFC2x3与IFC4两大主流模式。研究者既可基于单学科模型探索BIM数据解析与转换的通用方法,亦可利用配对的建筑-结构模型深入研究跨学科协同建模中的信息一致性、异构数据融合等基础科学问题。数据集配套开源的IFC2StructuredData工具,更可将模型对象属性与几何信息高效提取为结构化数据,显著降低了领域入门门槛。
实际应用
在实际工程应用中,GNI BIM Dataset为建筑行业的数字化质量控制、模型合规性审查及协同设计工作流优化提供了宝贵的训练与验证素材。基于该数据集,工程团队可开发智能化的BIM模型完整性检查工具,自动识别IFC文件中版本兼容性隐患、缺失构件或属性定义不一致等问题。此外,数据集中的多学科配对模型为建筑结构协同设计平台的接口测试与性能评估提供了真实用例,助力企业实现从设计到施工的全生命周期数据贯通。通过对学生作业中典型建模风格的统计分析,行业组织还能更精准地制定BIM实施指南与培训标准,从而提升整体数字化建造水平。
衍生相关工作
该数据集的发布已催生了一系列开创性的衍生工作。最显著的是与之配套的IFC2StructuredData开源工具,通过将庞大的IFC模型高效解析为结构化表格与三维几何文件,架起了BIM数据与主流数据分析框架之间的桥梁,为后续基于机器学习的建筑构件分类、空间关系推理等工作提供了标准化的输入接口。基于该数据集的42种IfcElement子类共29万余个构件实例,研究者开发了跨模式BIM模型比对算法与多学科语义对齐网络,在构件匹配精确率与异构数据融合度上取得了突破性进展。此外,数据集中配对的建筑-结构模型直接推动了协同设计中的信息一致性研究,相关成果已应用于自动化模型审查与冲突检测系统的优化。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作