five

ZAHA|3D建模数据集|语义分割数据集

收藏
arXiv2024-11-11 更新2024-11-11 收录
3D建模
语义分割
下载链接:
https://github.com/OloOcki/zaha
下载链接
链接失效反馈
资源简介:
ZAHA数据集是由慕尼黑工业大学创建的,是目前最大的3D立面语义分割数据集,包含601亿个标注点。数据集涵盖了多种建筑风格的66个立面,提供了15个与立面相关的类别。数据集的创建基于国际城市建模标准,确保了与现实世界挑战性类别的兼容性和方法的统一比较。数据集的创建过程利用了移动激光扫描(MLS)设备获取的密集街道级点云数据,并进行了详细的语义标注。ZAHA数据集主要应用于3D立面语义分割和城市数字孪生的创建,旨在解决立面语义分割中的挑战性问题。
提供机构:
慕尼黑工业大学
创建时间:
2024-11-08
原始信息汇总

ZAHA 数据集概述

数据集简介

  • 名称: ZAHA
  • 类型: 点云数据集
  • 用途: 立面语义分割
  • 规模: 包含 601 百万个标注点
  • 特点:
    • 引入 LoFG(Level of Facade Generalization),支持立面的层次化理解
    • 包含多种建筑风格
    • 提供本地和全球(UTM)坐标参考系统
    • 文件名指向巴伐利亚官方 CityGML LoD2 建筑模型

数据下载

数据集亮点

  • 601 百万标注点
  • 引入 LoFG:Level of Facade Generalization,支持立面的层次化理解
  • 多种建筑风格
  • 本地和全球(UTM)坐标参考系统
  • 文件名指向官方 CityGML LoD2 建筑模型

立面语义分割结果

LoFG3 结果

模型 OA P R F1 IoU
PointNet 59.9 46.1 42.2 38.7 26.4
PointNet++ 66.4 37.8 35.9 34.8 25.6
Point Transformer 75.0 52.7 54.7 52.1 41.6
DGCNN 71.1 53.6 45.8 44.5 33.4

LoFG2 结果

模型 OA P R F1 IoU
PointNet 71.9 69.6 68.1 68.1 55.8
PointNet++ 75.5 73.0 73.0 72.6 59.8
Point Transformer 78.2 75.8 76.6 76.1 63.9
DGCNN 82.6 80.0 81.8 80.4 68.5

引用

plain @article{wysockietalZAHA, author = {Wysocki, O. and Tan, Y. and Froech, T. and Xia, Y. and Wysocki, M. and Hoegner, L. and Cremers, D. and Holst Ch.}, title = {ZAHA: Introducing the Level of Facade Generalization and the Large-Scale Point Cloud Facade Semantic Segmentation Benchmark Dataset}, booktitle = {Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)}, year = {2025}, }

plain @misc{wysocki2024zahaintroducinglevelfacade, title={ZAHA: Introducing the Level of Facade Generalization and the Large-Scale Point Cloud Facade Semantic Segmentation Benchmark Dataset}, author={Olaf Wysocki and Yue Tan and Thomas Froech and Yan Xia and Magdalena Wysocki and Ludwig Hoegner and Daniel Cremers and Christoph Holst}, year={2024}, eprint={2411.04865}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2411.04865}, }

AI搜集汇总
数据集介绍
main_image_url
构建方式
ZAHA数据集的构建基于国际城市建模标准,通过引入Level of Facade Generalization (LoFG) 这一新颖的分层立面类别,确保了与现实世界中复杂类别的兼容性及方法比较的一致性。该数据集利用移动激光扫描(MLS)设备,从慕尼黑市采集了66个不同建筑风格的立面,生成了包含601百万个标注点的3D立面语义分割数据集。这些点云数据被细分为五个和十五个LoFG2和LoFG3类别,分别进行标注。此外,数据集的构建过程中还结合了CityGML、IFC和Art and Architecture Thesaurus (AAT)等国际标准,以确保类别定义的准确性和一致性。
特点
ZAHA数据集的主要特点在于其规模之大和类别之丰富,是目前最大的3D立面语义分割数据集,提供了超过601百万个标注点。其分层类别设计(LoFG)不仅涵盖了从抽象到具体的多个层次,还确保了与现有3D语义重建类别的无缝对接。此外,数据集包含了多种建筑风格和功能的立面,极大地增强了算法的泛化能力和实际应用价值。
使用方法
ZAHA数据集适用于开发和验证3D立面语义分割算法,特别适用于需要处理复杂和多样化立面元素的应用场景。研究者可以使用该数据集训练深度学习模型,如PointNet、PointNet++、Point Transformer和DGCNN等,以提升算法在立面分割任务中的表现。数据集的分层类别设计允许研究者在不同抽象层次上评估和比较算法性能,从而更全面地理解和改进立面分割技术。
背景与挑战
背景概述
ZAHA数据集由慕尼黑工业大学的研究人员于2024年创建,旨在解决建筑立面语义分割的长期挑战。该数据集引入了立面泛化级别(LoFG),这是一种基于国际城市建模标准的新型分层立面类别,确保与现实世界中的复杂类别兼容,并提供统一的方法比较。ZAHA数据集是目前最大的语义3D立面分割数据集,提供了601亿个标注点,涵盖五个和十五个LoFG2和LoFG3类别。该数据集的推出不仅填补了立面类别和数据的空白,还为城市数字孪生的创建提供了不可或缺的鲁棒分割方法。
当前挑战
ZAHA数据集在构建过程中面临多个挑战。首先,立面类别的异质性导致了对立面元素特征的误解,阻碍了大规模高变异性数据集的开发。其次,现有数据集中标注的立面样本有限,仅有的两个数据集TUM-FAC¸ ADE和ArCH分别专注于单一大学数据集和特定文化遗产建筑。此外,ZAHA数据集还面临着处理消费者级移动激光扫描(MLS)设备获取的未过滤点云数据的挑战,这些数据包含未修正的噪声和动态物体,以及内部反射和邻近立面物体。这些因素共同构成了ZAHA数据集在立面语义分割领域的主要挑战。
常用场景
经典使用场景
ZAHA数据集在建筑立面语义分割领域展现了其经典应用场景。通过提供601百万个标注点,该数据集支持了五类和十五类的立面元素分割,为研究人员提供了一个大规模、高变异性的基准。ZAHA不仅涵盖了从住宅到文化遗产建筑的多种风格,还通过引入Level of Facade Generalization (LoFG) 概念,确保了与国际城市建模标准的兼容性,从而促进了方法的统一比较和实际应用的稳健性。
解决学术问题
ZAHA数据集解决了建筑立面语义分割中的多个学术研究问题。首先,它填补了现有数据集中立面类别异质性和样本量有限的空白,通过提供大规模、多样的立面点云数据,推动了算法的泛化能力研究。其次,ZAHA引入了LoFG,这一基于国际标准的分层立面类别系统,解决了立面元素分类不一致的问题,为方法的评估和比较提供了统一框架。此外,该数据集还揭示了现有方法在处理复杂和稀有类别时的局限性,激发了新的研究方向。
衍生相关工作
ZAHA数据集的发布催生了多项相关经典工作。研究者们基于ZAHA开发了多种立面语义分割算法,显著提升了分割精度和对复杂类别的识别能力。例如,PointNet和PointNet++在ZAHA上的应用展示了其在点云数据处理中的强大潜力。此外,ZAHA还促进了跨领域的研究,如将立面分割结果应用于3D建筑模型的自动生成和城市环境的语义理解。这些工作不仅丰富了计算机视觉和摄影测量学的研究内容,也为实际应用提供了技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

大学生运动和体质健康数据集(2014-2023)

《大学生运动与体质健康数据集(2014-2023)》涵盖了大学生群体在运动能力、基础身体形态、身体机能及身体素质等多个方面的关键基础数据。该数据集的采集时间跨度为2014年至2023年,样本采集自全国34个省级行政区域,共计123281名大学生参与,平均年龄为20.53岁。建立大学生运动和体质健康数据集可以准确把握学生体质健康的整体水平和变化趋势,了解大学生运动和体质健康状况,对指导个性化健康干预、优化体育教育资源配置、支持促进科学研究以及提高公众健康意识等均具有重要意义。

国家人口健康科学数据中心 收录

DeepPCB

DeepPCB是由上海交通大学图像处理与模式识别研究所创建的首个公开PCB缺陷检测数据集,包含1,500对标注了6种常见PCB缺陷位置的图像。数据集通过模板匹配技术确保图像对齐,减少预处理工作量。每对图像包括一个640x640像素的无缺陷模板和一个有缺陷的测试图像。数据集旨在解决PCB制造中的自动缺陷检测问题,提高检测效率和准确性。

arXiv 收录