StreetSurfaceVis
收藏arXiv2024-07-31 更新2024-08-02 收录
下载链接:
https://doi.org/10.5281/zenodo.11449977
下载链接
链接失效反馈官方服务:
资源简介:
StreetSurfaceVis数据集由柏林技术与经济高等专业学院创建,包含9,122张来自众包平台Mapillary的街道级别图像,这些图像被手动标注了道路表面类型和质量。数据集的创建旨在训练模型以全面评估道路网络的表面状况。数据集的创建过程包括使用OpenStreetMap标签进行预过滤、迭代训练和应用表面类型分类模型等策略。该数据集主要应用于道路表面状况评估,旨在提高交通安全和舒适性,特别是对于自行车和轮椅用户等弱势道路使用者。
The StreetSurfaceVis dataset was developed by the Berlin School of Economics and Law. It contains 9,122 street-level images sourced from the crowdsourcing platform Mapillary, which have been manually annotated with road surface types and quality. The dataset was created to train models for comprehensive assessment of road network surface conditions. Its development process included strategies such as pre-filtering using OpenStreetMap tags, iterative training, and application of surface type classification models. This dataset is primarily applied for road surface condition assessment, aiming to improve traffic safety and comfort, especially for vulnerable road users such as cyclists and wheelchair users.
提供机构:
柏林技术与经济高等专业学院 (HTW Berlin)
创建时间:
2024-07-31
搜集汇总
数据集介绍

构建方式
StreetSurfaceVis 数据集是通过众包平台 Mapillary 收集的街景图像,并由人工标注了路面类型和质量。为了确保数据的多样性和覆盖范围,数据集仅限于德国地区,并限制了每个地点和序列的图像数量,以增加空间多样性、相机规格、环境条件和摄影视角。数据集的标签方案主要与 OpenStreetMap 的路面类型和光滑度标签一致,包括沥青、混凝土、铺路石、鹅卵石和非铺装路面等类型,以及从优秀到非常差的质量等级。数据集的构建过程中,使用了半自动标注策略,包括使用 OpenStreetMap 标签进行预筛选、迭代训练和应用自定义表面类型分类模型,以及通过基于提示的分类和基于图像嵌入的相似性搜索来放大代表性不足的类别。
特点
StreetSurfaceVis 数据集的特点在于其包含了大量的街景图像,涵盖了各种路面类型和质量,从而为训练鲁棒的分类模型提供了基础。数据集的标注方案详细,包括路面类型和质量的描述,并且通过半自动标注策略有效地减少了人工标注的工作量,同时确保了每个类别的充分代表性。此外,数据集还提供了五个不同人口规模和地区的德国城市作为测试数据,以测试模型的泛化能力。
使用方法
使用 StreetSurfaceVis 数据集时,建议将其分为训练集和测试集,其中测试数据应包括地理上不同的区域,以确保模型能够泛化到未见过的区域。数据集的标签方案详细,包括路面类型和质量的描述,可以帮助研究者更好地理解和使用数据。此外,数据集还提供了半自动标注策略的详细信息,可以帮助研究者根据需要调整和改进标注过程。
背景与挑战
背景概述
道路表面的平整度对于交通参与者的安全和舒适度具有重要影响,特别是对于自行车骑行者和轮椅使用者等脆弱的道路使用者。StreetSurfaceVis数据集是一个由9,122张街道级图像组成的新颖数据集,这些图像来自众包平台,并由道路表面类型和质量进行了人工标注。该数据集旨在训练模型,对道路网络进行全面的表面评估。现有的公开数据集在地理空间覆盖和相机设置方面受到限制,通常不包括自行车道和人行道。通过构建一个异构数据集,我们旨在填补这一空白,并使模型能够在不同的图像来源中保持高精度。然而,道路表面类型和质量的频率分布高度不平衡。为了确保每个类别都有足够的图像,同时减少人工标注的工作量,我们提出了一种采样策略,该策略结合了各种外部标签预测资源。更具体地说,我们评估了(1)使用OpenStreetMap标签丰富图像数据,(2)迭代训练和应用定制的表面类型分类模型,(3)通过基于提示的分类与GPT-4o或使用图像嵌入进行相似度搜索来放大代表性不足的类别。我们表明,利用这些策略的组合有效地减少了人工标注工作量,同时确保了每个类别的充分代表性。
当前挑战
StreetSurfaceVis数据集面临的挑战包括确保每个类别都有足够的图像,同时减少人工标注的工作量。由于道路表面类型和质量的频率分布高度不平衡,因此难以收集每个相关类别的足够图像,而无需进行不可行的人工标注工作。为了解决这个问题,我们提出了一种采样策略,该策略结合了各种外部标签预测资源,包括OpenStreetMap标签、迭代训练的定制表面类型分类模型以及基于GPT-4o的提示分类或使用图像嵌入的相似度搜索。通过这些策略,我们能够有效地减少人工标注工作量,同时确保每个类别的充分代表性。
常用场景
经典使用场景
StreetSurfaceVis数据集通过收集9,122张街景图像,并对其路面类型和质量进行半自动化标注,为道路网络的全面表面评估模型的训练提供了宝贵的数据资源。该数据集在图像来源、相机设置和地理位置覆盖上具有多样性,从而使得训练出的模型能够适应不同的图像来源,并在评估道路表面状况时保持高精度。
解决学术问题
StreetSurfaceVis数据集解决了现有开放数据集在地理位置覆盖和相机设置上的限制,以及缺乏对自行车道和人行道的考虑。通过创建一个异构的数据集,该数据集填补了这一空白,并使得训练出的模型能够更好地泛化到新的数据。此外,StreetSurfaceVis数据集还解决了数据集中路面类型和质量的频率分布不平衡的问题,通过采用一种采样策略,在减少手动标注工作量的同时确保每个类别有足够的图像。
衍生相关工作
StreetSurfaceVis数据集的发布和研究成果对相关领域的研究和实践产生了积极的影响。该数据集的发布促进了道路表面评估模型的训练和评估,并为相关领域的研究提供了数据资源。此外,StreetSurfaceVis数据集的研究成果还为半自动化标注策略提供了参考,为未来相关领域的研究和实践提供了启示。
以上内容由遇见数据集搜集并总结生成



