SUM-Helsinki

Name: SUM-Helsinki
Creator: 代尔夫特理工大学建筑与建成环境学院3D地理信息研究组
Published: 2021-07-13 22:25:37
License: 暂无描述

arXiv2021-07-13 更新2024-06-21 收录

下载链接：

https://3d.bk.tudelft.nl/projects/meshannotation/

下载链接

链接失效反馈

官方服务：

资源简介：

SUM-Helsinki数据集是由代尔夫特理工大学3D地理信息研究组创建的一个大型语义城市网格数据集，覆盖了赫尔辛基约4平方公里的区域，包含1900万个三角形。数据集通过结合航空倾斜图像生成，涵盖了六种常见的城市环境对象类别：地形、高植被、建筑、水体、车辆和船只。创建过程中采用了半自动标注框架，包括初始分割和交互式细化，显著节省了约600小时的标注工作。该数据集主要用于城市场景理解、空间分析和城市规划等应用，旨在通过深度学习方法提升对城市环境的理解和分析能力。

The SUM-Helsinki dataset is a large-scale semantic urban grid dataset developed by the 3D Geospatial Information Research Group of Delft University of Technology. It covers an area of approximately 4 square kilometers in Helsinki and contains 19 million triangles. Constructed by combining aerial oblique images, this dataset covers six common urban environmental object categories: terrain, high vegetation, buildings, water bodies, vehicles, and vessels. A semi-automatic annotation framework including initial segmentation and interactive refinement was adopted during its creation, which significantly saved approximately 600 hours of annotation work. This dataset is mainly used for applications such as urban scene understanding, spatial analysis and urban planning, aiming to enhance the understanding and analysis capabilities of urban environments through deep learning methods.

提供机构：

代尔夫特理工大学建筑与建成环境学院3D地理信息研究组

创建时间：

2021-02-28

搜集汇总

数据集介绍

构建方式

在三维城市建模领域，纹理网格作为表达城市环境的重要数据形式，其语义标注对场景理解至关重要。SUM-Helsinki数据集的构建采用了创新的半自动标注框架，以芬兰赫尔辛基约4平方公里的城市纹理网格为基础。该框架首先通过基于区域生长的过分割技术将网格划分为平面片段，随后提取几何与辐射特征，并利用随机森林分类器进行初始语义标注，实现了93.0%的整体分类准确率。标注过程中，开发了专用的三维网格标注工具，支持在三角形和片段级别进行交互式精细化修正，最终生成包含六类城市对象、约1900万个三角形的语义标注数据集，相比全手动标注节省了约600小时工作量。

特点

作为面向城市语义理解的大规模基准数据集，SUM-Helsinki具备多维度显著特点。数据集覆盖了地形、高层植被、建筑、水体、车辆与船只六类典型城市对象，并包含未分类区域，总计约4平方公里范围，体现了城市环境的多样性与复杂性。其数据载体为带纹理的三角网格，兼具几何精确性与视觉真实性，克服了点云数据缺乏拓扑结构的局限。数据集的类别分布呈现不均衡性，建筑与地形占比超过70%，而车辆、船只等小尺度对象占比较低，这为语义分割算法的鲁棒性提出了挑战。此外，数据集提供了完整的纹理信息与语义标签，支持基于网格或采样点云的多模态算法评估。

使用方法

SUM-Helsinki数据集为三维语义分割研究提供了可靠的基准平台。研究者可将数据集划分为训练、验证与测试子集，用于监督学习算法的训练与评估。由于数据集以纹理网格形式提供，用户可直接利用其三角形面片及附带的几何、纹理特征进行网格语义分割算法开发。同时，数据集支持通过蒙特卡洛采样转换为带颜色的点云，以便适配主流点云深度学习框架（如PointNet++、KPConv等）。在评估方面，建议采用基于面片面积的交并比、整体准确率等指标，以公平反映算法在不同尺度对象上的性能。数据集与标注工具均已开源，便于社区进行算法比较、模型训练及进一步的数据标注扩展。

背景与挑战

背景概述

随着三维数据采集技术的飞速发展，城市纹理网格的快速获取成为可能，为城市环境理解与分析提供了新的数据基础。在此背景下，由代尔夫特理工大学3D地理信息研究组与CycloMedia技术公司合作，于2021年推出了SUM-Helsinki数据集。该数据集覆盖芬兰赫尔辛基约4平方公里区域，包含地形、高层植被、建筑、水体、车辆和船只六类常见城市对象，旨在为基于深度学习的语义分割研究提供大规模标注基准。其核心研究问题在于解决城市纹理网格语义分割中标注数据匮乏的瓶颈，通过半自动标注框架显著提升标注效率，对城市三维场景理解、空间分析与规划等领域具有重要推动作用。

当前挑战

SUM-Helsinki数据集面临的挑战主要体现在两个方面：在领域问题层面，城市纹理网格的语义分割需应对类别不平衡与对象多尺度性带来的难题，例如车辆、船只等小尺度对象在数据中占比不足5%，导致模型难以充分学习其特征；同时，网格数据中存在的阴影区域、扭曲表面等模糊区域也给精确分类带来困难。在构建过程层面，大规模网格的手动标注极为耗时，数据集中包含1900余万个三角面片，传统全手动标注需超过1000小时；为此，研究团队开发了融合过分割与随机森林分类的半自动框架，虽将标注时间缩减至约400小时，但仍需处理初始分割中的欠分割错误，并依赖人工交互式细化以保证标注质量。

常用场景

经典使用场景

在三维城市建模与场景理解领域，纹理网格数据因其紧凑存储与拓扑结构明确的优势，成为语义分割任务的重要载体。SUM-Helsinki数据集作为大规模语义城市网格基准，其经典使用场景在于为深度学习算法提供高质量的标注数据，以训练和评估三维语义分割模型。该数据集覆盖赫尔辛基约4平方公里区域，包含地形、建筑、高植被等六类常见城市对象，通过半自动标注框架生成，显著提升了标注效率，为城市环境的三维解析奠定了数据基础。

解决学术问题

SUM-Helsinki数据集主要解决了三维城市场景语义分割中标注数据稀缺与标注成本高昂的学术难题。传统上，大规模点云或网格数据的标注依赖全手动操作，耗时且易出错。该数据集通过引入半自动标注框架，结合过分割与随机森林分类器，实现了93.0%的整体分类准确率，将标注工作量从估计的1000小时缩减至400小时。这不仅缓解了监督学习对标注数据的依赖，还为三维网格语义分割方法的性能评估提供了可靠基准，推动了城市场景理解领域的研究进展。

衍生相关工作

围绕SUM-Helsinki数据集，已衍生出多项经典研究工作。在算法层面，研究者利用该数据集评估了PointNet、PointNet++、KPConv等先进三维分割网络的性能，推动了网格与点云语义分割方法的比较与优化。同时，数据集的半自动标注框架启发了后续标注工具的改进，如交互式边界细化与结构提取技术的集成。此外，基于该数据集的扩展工作包括多城市网格标注、部件级对象分类（如屋顶、立面）等，进一步丰富了三维城市语义数据集的多样性与应用深度。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集