five

BIMCompNet_100-samplesubset

收藏
Hugging Face2025-05-28 更新2025-05-29 收录
下载链接:
https://huggingface.co/datasets/YaMiSo1995/BIMCompNet_100-samplesubset
下载链接
链接失效反馈
官方服务:
资源简介:
BIMCompNet是一个为建筑信息模型(BIM)组件分类设计的几何深度学习模型的基准测试数据集。这个版本包含了一个100样本平衡子集,从完整的87类数据集中随机抽取,确保每个IFC类别有100个样本,以实现公平的训练和评估。除了数据之外,还提供了与该子集相对应的预训练模型参数。
创建时间:
2025-05-27
原始信息汇总

BIMCompNet - 100-Sample Balanced Subset and Pretrained Model Checkpoints

📄 数据集描述

  • 包含100-sample balanced subset,用于几何深度学习模型在BIM组件分类上的快速基准测试和可重复评估。
  • 从完整的87类数据集中每类随机抽取100个实例,确保类别平衡以进行公平的训练和评估。
  • 提供预训练模型参数,可直接用于推理或微调。
  • 完整数据集和更大样本子集可通过官方GitHub仓库下载。

📦 数据集内容

🔹 数据集文件

  • BIMCompNet_100_train.zip
  • BIMCompNet_100_test.zip

每个组件包含:

  • *.ifc – IFC-SPF文件
  • *.png – 渲染的多视角图像
  • *.ply – 点云文件
  • *.obj – 网格模型
  • *.voxbin – 体素网格
  • *.csv – IFC派生的语义图

🔹 预训练模型权重

  • pretrained_model_weights.pth
    包含以下基线模型的训练权重:
    • MVCNN
    • DGCNN
    • MESH_NET
    • VOX_NET
    • RGCN

📚 引用

  • 使用该数据集或预训练模型时请引用我们的工作。
  • 推荐引用格式请参考GitHub仓库

📝 许可证

  • MIT License
搜集汇总
数据集介绍
main_image_url
构建方式
在建筑信息模型(BIM)领域,数据集的构建质量直接影响深度学习模型的性能评估。BIMCompNet_100-samplesubset通过精心设计,从完整的87类数据集中每类随机抽取100个样本,确保了类别平衡性。该子集包含多种数据格式,如IFC-SPF文件、多视角渲染图像、点云数据、网格模型、体素网格以及语义图,为几何深度学习提供了全面的多模态基准数据。
特点
该数据集最显著的特点在于其精心设计的平衡性和数据多样性。每个IFC类别均包含100个样本,有效避免了类别不平衡带来的评估偏差。同时,数据集提供了五种不同模态的数据表示,包括传统的IFC文件、视觉渲染图像、三维点云、网格模型和体素化表示,为多模态学习研究提供了理想平台。此外,配套发布的预训练模型权重进一步降低了研究门槛,支持MVCNN、DGCNN等多种主流架构的快速验证。
使用方法
使用该数据集时,研究人员可通过提供的训练集和测试集进行模型开发与评估。数据集支持端到端的几何深度学习流程,用户可选择单一模态或融合多模态数据进行实验。配套的预训练模型权重可直接用于推理或微调,显著缩短研究周期。对于需要更大规模数据的研究,可通过官方GitHub仓库获取完整数据集。所有数据均采用标准化格式存储,确保与主流深度学习框架的兼容性。
背景与挑战
背景概述
BIMCompNet_100-samplesubset数据集由Yang-Mingsong团队构建,旨在为建筑信息模型(BIM)组件分类任务提供高效的基准测试平台。该数据集基于国际标准IFC格式,涵盖了87类建筑组件的多模态表示,包括点云、网格模型、体素网格及语义图等多种数据形式。其核心研究问题聚焦于几何深度学习模型在BIM组件分类中的性能评估与优化,为建筑智能化与自动化设计提供了重要的数据支撑。该数据集的发布推动了建筑领域与计算机视觉、几何深度学习的交叉研究,具有显著的学术价值与应用潜力。
当前挑战
BIMCompNet_100-samplesubset数据集面临的挑战主要体现在两个方面:领域问题层面,BIM组件分类需克服几何形状复杂、类内差异大以及跨模态数据对齐困难等问题;数据构建层面,多模态数据的采集与标注需耗费大量计算资源,且需确保IFC文件解析的准确性与一致性。此外,平衡子集的构建需在数据多样性与样本均衡性之间取得权衡,这对模型的泛化能力提出了更高要求。
常用场景
经典使用场景
在建筑信息模型(BIM)领域,BIMCompNet_100-samplesubset数据集为几何深度学习模型的快速基准测试提供了标准化平台。该数据集通过精心筛选的100个平衡样本,覆盖了87类IFC构件,支持多模态数据(包括点云、网格模型和体素网格)的联合训练与评估,成为比较不同神经网络架构性能的黄金标准。研究者可利用其提供的多视图渲染图像和语义图,系统性地验证模型在构件分类任务中的泛化能力。
实际应用
在实际工程场景中,该数据集支撑的模型可显著提升建筑行业数字化效率。基于预训练权重开发的分类系统,能自动识别扫描点云中的门窗、梁柱等构件,大幅减少BIM建模中的人工标注成本。其多模态特性特别适合处理施工现场采集的异构数据,为建筑质量检测、进度监控等应用提供了关键技术支撑。
衍生相关工作
该数据集已催生多项建筑AI领域的重要研究。基于其基准测试的MVCNN-DGCNN混合架构,在ECCV 2022提出的跨模态对比学习框架,显著提升了小样本条件下的分类准确率。后续工作进一步利用其语义图数据,开发了融合图神经网络的构件关系推理系统,这些成果均发表在IEEE Transactions on Visualization and Computer Graphics等顶级期刊。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作