ThaiRAP

Name: ThaiRAP
Creator: 伦敦大学学院土木、环境和测绘工程系
Published: 2024-08-20 22:03:30
License: 暂无描述

arXiv2024-08-20 更新2024-08-22 收录

下载链接：

http://arxiv.org/abs/2408.10872v1

下载链接

链接失效反馈

官方服务：

资源简介：

ThaiRAP数据集由伦敦大学学院土木、环境和测绘工程系创建，用于支持道路安全评估研究。该数据集包含2037张图像，覆盖泰国多个省份的519个道路段。数据集的创建遵循国际道路评估计划（iRAP）标准，涉及52个道路属性分类。数据集的目的是通过视觉语言模型（VLMs）优化道路安全评估，特别是在资源有限的地区。

The ThaiRAP dataset was developed by the Department of Civil, Environmental and Geomatic Engineering, University College London to support road safety assessment research. This dataset comprises 2,037 images covering 519 road segments across multiple provinces in Thailand. The dataset was constructed in accordance with the standards of the International Road Assessment Programme (iRAP) and includes 52 road attribute categories. The goal of this dataset is to optimize road safety assessment via Vision-Language Models (VLMs), particularly in resource-constrained regions.

提供机构：

伦敦大学学院土木、环境和测绘工程系

创建时间：

2024-08-20

搜集汇总

数据集介绍

构建方式

ThaiRAP数据集的构建采用了Mapillary平台上的众包街景图像。这些图像通过50米缓冲区筛选，确保与ThaiRAP地点的对应，且拍摄时间在编码日期一年之内。数据集中包含2037张图像，覆盖了曼谷、帕农塔尼和帕农克农省等地的519个路段。每个路段使用1至4张图像进行编码。在数据预处理阶段，数据集被分为训练集、测试集、验证集和未见过集，以确保在各个子集中各类别的样本数量均衡。此外，对于类别不平衡的问题，通过添加噪声数据对类别进行增强，以提升模型的泛化能力。

使用方法

ThaiRAP数据集的使用方法涉及视觉语言模型的框架V-RoAst，该框架通过输入图像及其相关信息提示，生成对52个道路属性的响应。使用V-RoAst框架时，需要提供任务描述、上下文信息和输出格式等指令。此外，V-RoAst框架还利用了VLMs的视觉问答（VQA）能力，使得非数据科学专家也能通过直观地调整提示来改进模型。这种方法使得当地利益相关者可以根据自己的专业知识定制提示，并通过与地面真实数据的比较来验证结果，从而提高模型的准确性。

背景与挑战

背景概述

ThaiRAP数据集的创建旨在解决道路交通事故导致的全球性问题，尤其是在中低收入国家（LMICs）。该数据集由伦敦大学学院（UCL）和朱拉隆功大学（Chulalongkorn University）的研究人员共同开发，旨在通过视觉语言模型（VLMs）进行道路安全评估，克服了传统卷积神经网络（CNNs）的局限性。ThaiRAP数据集的创建时间为2024年，主要研究人员包括Natchapon Jongwiriyanurak、Zichao Zeng、June Moh Goo等。该数据集的核心研究问题是利用VLMs进行道路属性编码，以评估道路安全等级，并对相关领域产生了重要影响，为全球道路安全评估提供了成本效益高且自动化的解决方案。

当前挑战

ThaiRAP数据集面临着一些挑战。首先，在解决领域问题方面，传统的CNNs模型在处理具有类不平衡问题的数据集时，容易出现过拟合现象，导致在预测特定属性时准确性下降。其次，在构建过程中，数据集的类不平衡问题也是一个挑战，部分属性的数据量较少，甚至缺失，这增加了多属性分类的难度。此外，VLMs在处理具有强空间特性的属性时，其性能相对较弱。为了克服这些挑战，研究人员提出了V-RoAst方法，利用VLMs的视觉问答（VQA）能力，通过提示工程来提高模型的预测准确性。同时，未来工作将考虑微调VLMs以增强其鲁棒性和适应性，并探索将其他模态，如遥感图像和地理信息数据，纳入道路评估中。

常用场景

经典使用场景

ThaiRAP数据集主要用于视觉语言模型（VLMs）在道路安全评估方面的研究。该数据集提供了实际道路场景的图像和属性信息，使得研究人员能够训练和评估VLMs在识别道路特征、评估道路安全等级等方面的能力。通过使用ThaiRAP数据集，研究人员可以开发出能够自动识别道路安全问题的模型，从而为道路安全评估提供了一种高效、自动化的方法。

解决学术问题

ThaiRAP数据集解决了传统道路安全评估方法的局限性，如人力成本高、数据标注困难等。此外，ThaiRAP数据集还解决了VLMs在处理空间属性方面的性能问题，为道路安全评估提供了新的思路和方法。ThaiRAP数据集的意义和影响在于，它为全球道路安全评估提供了一种高效、自动化的方法，有助于减少道路交通事故的发生，提高道路安全水平。

实际应用

ThaiRAP数据集的实际应用场景包括道路安全评估、道路基础设施维护、交通事故预防等。通过使用ThaiRAP数据集训练的模型，可以对道路进行自动评估，识别道路安全隐患，为道路安全维护提供数据支持。此外，ThaiRAP数据集还可以用于交通事故预防，通过分析道路特征和事故数据，预测交通事故发生的可能性，从而提前采取措施预防事故发生。

数据集最近研究