five

IFCNet

收藏
arXiv2021-06-18 更新2024-06-21 收录
下载链接:
https://ifcnet.e3d.rwth-aachen.de
下载链接
链接失效反馈
官方服务:
资源简介:
IFCNet是由德国亚琛工业大学可持续建筑与能源效率研究所开发的数据集,专注于建筑信息模型(BIM)中的实体分类。该数据集包含约19,613个单独的IFC文件,覆盖了广泛的IFC类,包括几何和语义信息。数据集的创建涉及从实际项目、学生作品和在线资源中收集约1000个IFC模型,并通过分解模型为单独实体进行处理。IFCNet旨在通过提供一个标准化的性能评估基准,促进BIM和IFC领域的研究,特别是在机器学习和深度学习方法的应用上,以解决BIM模型在不同软件产品间交换时的信息丢失和分类不一致问题。

IFCNet is a dataset developed by the Institute for Sustainable Building and Energy Efficiency, RWTH Aachen University, Germany, focusing on entity classification in Building Information Modeling (BIM). The dataset contains approximately 19,613 individual IFC files, covering a wide range of IFC classes including both geometric and semantic information. The development of this dataset involves collecting approximately 1,000 IFC models from real-world projects, student works and online resources, and processing these models by decomposing them into individual entities. IFCNet aims to promote research in the BIM and IFC domains by providing a standardized performance evaluation benchmark, particularly for the application of machine learning and deep learning methods, to address the issues of information loss and inconsistent classification when BIM models are exchanged between different software products.
提供机构:
可持续建筑与能源效率研究所
创建时间:
2021-06-18
搜集汇总
数据集介绍
main_image_url
构建方式
在建筑信息模型(BIM)领域,提升不同软件间的互操作性至关重要,而IFCNet数据集的构建为此提供了关键资源。该数据集通过收集约1000个来自实际项目、学生作品及在线开源库的IFC模型,涵盖Autodesk Revit和ArchiCAD等多种建模软件生成的多样化数据。随后,模型被分解为独立实体,提取出约120万个对象,覆盖82个IFC类别,并包含几何与语义信息。通过基于顶点哈希映射的去重技术,将数据精简至约29万个实体,再经由领域专家使用定制化网络工具进行手动审核与分类校正,最终形成包含19,613个确认对象的基准数据集,确保了数据的高质量与代表性。
特点
IFCNet数据集以其广泛的类别覆盖和真实世界数据的多样性而著称,核心子集IFCNetCore包含20个类别共7,930个对象,充分体现了建筑元素的实际分布。数据集不仅囊括了从墙体、梁柱到家具、管道等多种实体,还捕捉了同类对象内部的巨大差异,例如家具类别涵盖从座椅到衣柜的多种形态。同时,数据集中包含了不同信息需求层级的模型,既有详细几何表达,也有仅具占位符外观的通用对象,这模拟了实际工程中几何与语义信息不完整的常见场景。此外,数据集中附带的属性集以多语言形式呈现,进一步增强了其在跨语言环境下的适用性。
使用方法
IFCNet数据集为机器学习算法在BIM语义增强领域的训练与评估提供了标准化基准。研究者可借助该数据集开发分类模型,例如通过多视图卷积神经网络(MVCNN)处理对象的二维投影,或利用动态图卷积网络(DGCNN)和MeshNet分别分析点云与网格数据。使用前,需按照实验协议将数据集划分为训练集、验证集和测试集,并进行数据格式转换,如为MVCNN渲染多视角图像,为DGCNN采样点云。训练过程中,通过平衡精度等指标优化超参数,最终在测试集上评估模型性能。该数据集支持几何信息的单独使用,也为未来融合语义属性的研究奠定了基础,助力于BIM工作流中的自动分类与错误检测。
背景与挑战
背景概述
在建筑信息模型(BIM)领域,提升不同专业软件间的互操作性与信息交换能力,是建筑、工程、施工与运营(AECO)行业实现全生命周期管理的关键。然而,工业基础类(IFC)标准因其涵盖概念广泛、实体数量庞大且结构复杂,导致模型交换过程中常出现信息丢失或语义不一致的问题,这严重影响了跨学科协作的效率。为应对这一挑战,德国亚琛工业大学可持续建筑能源效率研究所的研究团队于近年创建了IFCNet数据集,旨在为IFC实体分类任务提供标准化的基准数据资源。该数据集汇集了来自真实项目、学术作品及开源库的IFC模型,通过提取单实体文件并融合几何与语义信息,为机器学习与深度学习算法在BIM语义增强方面的应用奠定了数据基础,推动了智能建模与自动化校验等研究方向的发展。
当前挑战
IFCNet数据集致力于解决BIM领域中IFC实体自动分类的核心问题,其挑战主要体现在两方面:在领域问题层面,IFC标准实体间存在显著的类内方差与类间方差差异,例如IfcFurniture类别涵盖桌椅柜等多种家具,而IfcWall与IfcPlate等类别在几何形态上高度相似,仅凭形状难以区分;同时,不同信息详细程度的模型共存,部分对象仅具占位几何,需依赖元数据进行分类,这增加了纯几何方法的学习难度。在构建过程中,挑战源于数据集的创建与优化:首先,从异构BIM软件导出的IFC模型需经去重处理,但顶点顺序差异或非均匀缩放可能导致近重复对象漏检;其次,标注工作依赖领域专家手动审核与校正,过程耗时且资源密集;此外,元数据中多语言混杂、字段缺失或缩写不规范等问题,为语义信息的有效整合带来了预处理复杂性。
常用场景
经典使用场景
在建筑信息模型(BIM)领域,IFCNet数据集为几何深度学习算法的训练与评估提供了标准化基准。该数据集通过整合大量单实体IFC文件,覆盖了广泛的IFC类别,使得研究人员能够利用其丰富的几何与语义信息,开发并验证用于IFC实体分类的先进模型。例如,基于多视图卷积神经网络(MVCNN)、动态图卷积网络(DGCNN)和MeshNet等架构,研究者可在IFCNet上实现高精度的对象分类,推动BIM语义增强技术的进步。
解决学术问题
IFCNet数据集有效应对了BIM领域因IFC标准复杂性导致的信息丢失与实体误映射问题。通过提供大规模标注数据,它支持机器学习方法自动识别和纠正IFC模型中的分类不一致性,从而提升跨软件数据交换的语义完整性。该数据集不仅解决了训练数据稀缺的瓶颈,还为几何深度学习在建筑领域的应用奠定了实证基础,促进了BIM互操作性研究的标准化与可重复性。
衍生相关工作
IFCNet的发布催生了多项基于几何深度学习的BIM语义增强研究。例如,学者们借鉴PointNet和MVCNN等架构,开发了针对道路基础设施或室内家具的分类模型;同时,该数据集促进了跨领域迁移学习方法的探索,如利用大规模图像数据集预训练模型并微调于IFC数据。这些工作不仅扩展了IFCNet的应用范围,也为构建更全面的BIM基准数据集提供了方法论参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作