Synthetic Building Dataset

github2021-12-19 更新2024-05-31 收录

下载链接：

https://github.com/CDInstitute/Building-Dataset-Generator

下载链接

链接失效反馈

官方服务：

更多采购需求

资源简介：

该数据集通过生成合成建筑模型，包括建筑的网格文件、渲染图像、分割掩码、深度注释、表面法线注释和点云文件。数据集用于支持建筑领域的几何深度学习研究。

This dataset is generated by synthesizing architectural models, including mesh files, rendered images, segmentation masks, depth annotations, surface normal annotations, and point cloud files. The dataset is designed to support geometric deep learning research in the field of architecture.

创建时间：

2021-04-21

原始信息汇总

数据集概述

数据集生成工具

功能: 生成不同类型建筑的合成数据集。
作者: Stanislava Fedorova, Alberto Tono, Meher Shashwat Nigam, Jiayao Zhang, Amirhossein Ahmadnia, Cecilia Bolognesi, Dominik L. Michels。

数据内容

Mesh文件: 生成建筑的网格文件，格式为.obj。
渲染图像: 网格的渲染图像，格式为.png。
渲染分割掩码: 分割掩码图像，格式为.png。
深度标注: 深度图像，格式为.png和.exr。
表面法线标注: 表面法线图像，格式为.png。
点云文件: 点云数据，格式为.ply，默认点数为2048。

数据集参数配置

配置文件: dataset_config.py
默认参数:
- 最小高度: 3m
- 最小长度和宽度: 6m
- 最大长度、宽度、高度: 30m
其他配置:
- 数据集样本数量
- 建筑类型
- 组件材料
- 渲染图像尺寸
- 点云中的点数
- 数据存储路径
- 是否保存.exr文件

使用方法

安装: 需要安装Blender>=2.90，并设置环境变量。
运行: 使用run.bat或blender setup.blend --python dataset.py命令。

性能

测试环境: Windows 10, AMD Ryzen 7 3800-X 8-Core Processor, GeForce GTX 1080。
测试结果: 生成100个模型样本，多视角生成（每模型3视角）的时间为0.34至2.7小时。

引用格式

@inproceedings{fedorova2021synthetic, title={Synthetic 3D Data Generation Pipeline for Geometric Deep Learning in Architecture}, author={Stanislava Fedorova and Alberto Tono and Meher Shashwat Nigam and Jiayao Zhang and Amirhossein Ahmadnia and Cecilia Bolognesi and Dominik L. Michels}, year={2021}, }

搜集汇总

数据集介绍

构建方式

Synthetic Building Dataset通过一个专门设计的工具生成，该工具利用Blender软件和Python脚本，能够创建多种建筑类型的合成数据。数据集的生成过程包括建筑模型的创建、渲染图像的生成、分割掩码的渲染、深度注释、表面法线注释以及点云文件的生成。所有参数，如建筑的高度、长度、宽度、材料类型等，均可在dataset_config.py文件中进行配置，确保了数据集的灵活性和多样性。

特点

该数据集的显著特点在于其高度合成性和多样性，涵盖了从建筑模型到深度图、分割掩码和点云数据的全方位信息。每栋建筑的模型、渲染图像、分割掩码、深度图和点云数据均以标准格式（如.obj、.png、.ply等）存储，便于后续的分析和处理。此外，数据集支持多种建筑类型和材料，能够满足不同研究需求。

使用方法

使用该数据集首先需要安装Blender软件，并确保其路径已添加到系统环境变量中。接着，通过运行提供的Python脚本或批处理文件，可以生成所需的合成建筑数据。用户可以根据需要在dataset_config.py文件中调整参数，如建筑的尺寸、材料、渲染图像的分辨率等。生成的数据可以用于计算机视觉、建筑分析、深度学习等多个领域的研究。

背景与挑战

背景概述

Synthetic Building Dataset 是由 Stanislava Fedorova、Alberto Tono 等研究人员于2021年创建的，旨在为建筑几何深度学习领域提供高质量的合成数据。该数据集通过生成不同类型的建筑模型，包括网格文件、渲染图像、分割掩码、深度注释、表面法线注释和点云文件，为建筑领域的研究提供了丰富的数据资源。这些数据不仅符合国际标准，还涵盖了多种建筑材料和尺寸，极大地推动了建筑几何深度学习的发展，尤其是在建筑设计、城市规划和计算机视觉等领域的应用。

当前挑战

Synthetic Building Dataset 在构建过程中面临多项挑战。首先，生成高质量的合成建筑数据需要复杂的算法和精确的参数设置，以确保生成的建筑模型在几何和视觉上均符合实际建筑的标准。其次，数据集的多样性和规模也是一个挑战，需要平衡不同建筑类型、材料和尺寸的分布，以满足广泛的研究需求。此外，渲染和生成过程对计算资源的要求较高，尤其是在多视角生成时，时间和计算成本显著增加。这些挑战不仅影响了数据集的生成效率，也对后续的研究和应用提出了更高的技术要求。

常用场景

经典使用场景

Synthetic Building Dataset 主要用于建筑几何深度学习领域，其经典使用场景包括建筑物的三维重建、语义分割以及点云生成。通过提供高质量的合成建筑模型及其对应的渲染图像、分割掩码、深度图和表面法线等信息，该数据集为研究人员提供了丰富的训练数据，以提升模型在复杂建筑结构中的识别与分析能力。

实际应用

在实际应用中，Synthetic Building Dataset 可用于城市规划、建筑设计与维护、自动驾驶等领域。例如，通过分析合成建筑的点云数据，可以实现对建筑物结构的自动化检测与评估，从而提高建筑维护效率；在自动驾驶中，该数据集可用于训练车辆识别和理解复杂的城市环境。

衍生相关工作

基于 Synthetic Building Dataset，许多相关工作得以展开，包括但不限于建筑物的三维重建算法优化、语义分割模型的改进以及点云生成技术的创新。此外，该数据集还激发了在合成数据生成技术上的进一步研究，推动了合成数据在其他领域的应用，如机器人视觉和虚拟现实。

以上内容由遇见数据集搜集并总结生成

社区讨论

#经验分享

【我遇到的问题】 • 现象：该数据集的下载链接已失效【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72

5,000+

优质数据集

54 个

任务类型

进入经典数据集