five

Synthetic Building Dataset|建筑数据集|深度学习数据集

收藏
github2021-12-19 更新2024-05-31 收录
建筑
深度学习
下载链接:
https://github.com/CDInstitute/Building-Dataset-Generator
下载链接
链接失效反馈
资源简介:
该数据集通过生成合成建筑模型,包括建筑的网格文件、渲染图像、分割掩码、深度注释、表面法线注释和点云文件。数据集用于支持建筑领域的几何深度学习研究。

This dataset is generated by synthesizing architectural models, including mesh files, rendered images, segmentation masks, depth annotations, surface normal annotations, and point cloud files. The dataset is designed to support geometric deep learning research in the field of architecture.
创建时间:
2021-04-21
原始信息汇总

数据集概述

数据集生成工具

  • 功能: 生成不同类型建筑的合成数据集。
  • 作者: Stanislava Fedorova, Alberto Tono, Meher Shashwat Nigam, Jiayao Zhang, Amirhossein Ahmadnia, Cecilia Bolognesi, Dominik L. Michels。

数据内容

  • Mesh文件: 生成建筑的网格文件,格式为.obj
  • 渲染图像: 网格的渲染图像,格式为.png
  • 渲染分割掩码: 分割掩码图像,格式为.png
  • 深度标注: 深度图像,格式为.png.exr
  • 表面法线标注: 表面法线图像,格式为.png
  • 点云文件: 点云数据,格式为.ply,默认点数为2048。

数据集参数配置

  • 配置文件: dataset_config.py
  • 默认参数:
    • 最小高度: 3m
    • 最小长度和宽度: 6m
    • 最大长度、宽度、高度: 30m
  • 其他配置:
    • 数据集样本数量
    • 建筑类型
    • 组件材料
    • 渲染图像尺寸
    • 点云中的点数
    • 数据存储路径
    • 是否保存.exr文件

使用方法

  • 安装: 需要安装Blender>=2.90,并设置环境变量。
  • 运行: 使用run.batblender setup.blend --python dataset.py命令。

性能

  • 测试环境: Windows 10, AMD Ryzen 7 3800-X 8-Core Processor, GeForce GTX 1080。
  • 测试结果: 生成100个模型样本,多视角生成(每模型3视角)的时间为0.34至2.7小时。

引用格式

@inproceedings{fedorova2021synthetic, title={Synthetic 3D Data Generation Pipeline for Geometric Deep Learning in Architecture}, author={Stanislava Fedorova and Alberto Tono and Meher Shashwat Nigam and Jiayao Zhang and Amirhossein Ahmadnia and Cecilia Bolognesi and Dominik L. Michels}, year={2021}, }

AI搜集汇总
数据集介绍
main_image_url
构建方式
Synthetic Building Dataset通过一个专门设计的工具生成,该工具利用Blender软件和Python脚本,能够创建多种建筑类型的合成数据。数据集的生成过程包括建筑模型的创建、渲染图像的生成、分割掩码的渲染、深度注释、表面法线注释以及点云文件的生成。所有参数,如建筑的高度、长度、宽度、材料类型等,均可在dataset_config.py文件中进行配置,确保了数据集的灵活性和多样性。
特点
该数据集的显著特点在于其高度合成性和多样性,涵盖了从建筑模型到深度图、分割掩码和点云数据的全方位信息。每栋建筑的模型、渲染图像、分割掩码、深度图和点云数据均以标准格式(如.obj、.png、.ply等)存储,便于后续的分析和处理。此外,数据集支持多种建筑类型和材料,能够满足不同研究需求。
使用方法
使用该数据集首先需要安装Blender软件,并确保其路径已添加到系统环境变量中。接着,通过运行提供的Python脚本或批处理文件,可以生成所需的合成建筑数据。用户可以根据需要在dataset_config.py文件中调整参数,如建筑的尺寸、材料、渲染图像的分辨率等。生成的数据可以用于计算机视觉、建筑分析、深度学习等多个领域的研究。
背景与挑战
背景概述
Synthetic Building Dataset 是由 Stanislava Fedorova、Alberto Tono 等研究人员于2021年创建的,旨在为建筑几何深度学习领域提供高质量的合成数据。该数据集通过生成不同类型的建筑模型,包括网格文件、渲染图像、分割掩码、深度注释、表面法线注释和点云文件,为建筑领域的研究提供了丰富的数据资源。这些数据不仅符合国际标准,还涵盖了多种建筑材料和尺寸,极大地推动了建筑几何深度学习的发展,尤其是在建筑设计、城市规划和计算机视觉等领域的应用。
当前挑战
Synthetic Building Dataset 在构建过程中面临多项挑战。首先,生成高质量的合成建筑数据需要复杂的算法和精确的参数设置,以确保生成的建筑模型在几何和视觉上均符合实际建筑的标准。其次,数据集的多样性和规模也是一个挑战,需要平衡不同建筑类型、材料和尺寸的分布,以满足广泛的研究需求。此外,渲染和生成过程对计算资源的要求较高,尤其是在多视角生成时,时间和计算成本显著增加。这些挑战不仅影响了数据集的生成效率,也对后续的研究和应用提出了更高的技术要求。
常用场景
经典使用场景
Synthetic Building Dataset 主要用于建筑几何深度学习领域,其经典使用场景包括建筑物的三维重建、语义分割以及点云生成。通过提供高质量的合成建筑模型及其对应的渲染图像、分割掩码、深度图和表面法线等信息,该数据集为研究人员提供了丰富的训练数据,以提升模型在复杂建筑结构中的识别与分析能力。
实际应用
在实际应用中,Synthetic Building Dataset 可用于城市规划、建筑设计与维护、自动驾驶等领域。例如,通过分析合成建筑的点云数据,可以实现对建筑物结构的自动化检测与评估,从而提高建筑维护效率;在自动驾驶中,该数据集可用于训练车辆识别和理解复杂的城市环境。
衍生相关工作
基于 Synthetic Building Dataset,许多相关工作得以展开,包括但不限于建筑物的三维重建算法优化、语义分割模型的改进以及点云生成技术的创新。此外,该数据集还激发了在合成数据生成技术上的进一步研究,推动了合成数据在其他领域的应用,如机器人视觉和虚拟现实。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

2017-2020年内蒙古当地杂豆的原料特性及生物活性物质分析数据集

参照国标对内蒙古当地的豌豆、赤小豆、绿豆、红芸豆及扁豆等五种杂豆的原料特性和生物活性物质含量进行测定,并进行对比分析。

国家农业科学数据中心 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。

arXiv 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录