Mapillary Traffic Sign Dataset (MTSD)
收藏arXiv2020-05-07 更新2024-07-25 收录
下载链接:
https://www.mapillary.com/dataset/trafficsign
下载链接
链接失效反馈资源简介:
Mapillary Traffic Sign Dataset (MTSD) 是由Mapillary研究机构创建的大型交通标志数据集,包含来自全球的100,000张街景图像,涵盖了多样化的场景、广泛的地理位置覆盖以及不同的天气和光照条件。数据集详细标注了超过300种交通标志类别,其中52,000张图像完全标注,48,000张图像部分标注。MTSD旨在为自动驾驶和智能城市时代提供准确的交通标志检测和分类算法,通过广泛的实验建立了强大的基准,并验证了该数据集在现有大规模基准数据集上的有效迁移学习能力。
Mapillary Traffic Sign Dataset (MTSD) is a large-scale traffic sign dataset developed by Mapillary Research. It comprises 100,000 street view images sourced from across the globe, encompassing diverse scenarios, extensive geographic coverage, and varied weather and lighting conditions. The dataset provides detailed annotations for over 300 traffic sign categories, with 52,000 images fully annotated and 48,000 images partially annotated. MTSD aims to support accurate traffic sign detection and classification algorithms for the era of autonomous driving and smart cities. It has established a robust benchmark through extensive experiments, and validated the effective transfer learning capability of this dataset on existing large-scale benchmark datasets.
提供机构:
Mapillary
创建时间:
2019-09-10
AI搜集汇总
数据集介绍

构建方式
Mapillary Traffic Sign Dataset (MTSD) 是通过从全球范围内收集街景图像,并对这些图像进行精细标注而构建的。数据集的构建过程分为三个主要步骤:图像选择、标注过程和数据集分割。图像选择阶段采用贪婪策略,确保了图像在全球范围内的均匀分布,覆盖了不同质量、不同条件下的图像。标注过程则由15位专家进行,分为图像审核、标志定位和标志分类三个连续的任务,每个任务都有其自身的质量控制流程。数据集被分割成训练集、验证集和测试集,以匹配图像的分布,并确保每个数据集都包含相似数量的类实例。
特点
MTSD 的特点包括:1) 全世界范围内收集的100K张街景图像,涵盖了超过300个手动标注的交通标志类别;2) 包括52K张完全标注的图像和48K张部分标注的图像,为交通标志检测和分类任务提供了大量的数据;3) 数据集覆盖了不同的场景、地理位置、天气和光照条件,使得数据集具有很高的多样性;4) 提供了部分标注的图像集,为半监督学习研究提供了数据源。
使用方法
MTSD 的使用方法如下:1) 下载数据集:可以从Mapillary的官方网站免费下载MTSD数据集;2) 数据预处理:根据研究需求对图像进行预处理,例如缩放、裁剪等;3) 模型训练:使用MTSD数据集对模型进行训练,可以选择使用Faster R-CNN、ResNet等模型;4) 模型评估:使用验证集对模型进行评估,评估指标包括平均精确度(AP)、平均准确率(mAP)等;5) 模型应用:将训练好的模型应用于实际场景,例如自动驾驶、智能交通等。
背景与挑战
背景概述
交通标志作为全球自主驾驶和智慧城市时代的关键地图特征,对于交通导航、交通控制和道路安全至关重要。为了开发准确和鲁棒的交通标志检测和分类算法,需要一个大规模且多样化的基准数据集。Mapillary Traffic Sign Dataset (MTSD) 是一个包含全球范围内 10 万张街景图像的数据集,这些图像涵盖了多样化的场景、广泛的地理位置、以及变化的天气和光照条件,并涵盖了 300 多个手动注释的交通标志类别。该数据集包括 52K 张完全注释的图像和 48K 张部分注释的图像,是迄今为止最大、最多样化的交通标志数据集,包括来自世界各地的图像,并具有对交通标志类别的细粒度注释。研究人员进行了广泛的实验,为检测和分类任务建立了强大的基线,并验证了该数据集的多样性能够有效促进现有大规模基准数据集上的交通标志检测和分类的迁移学习。
当前挑战
尽管 MTSD 数据集在交通标志检测和分类方面取得了显著的进展,但仍面临一些挑战。首先,交通标志在街道场景中容易与其他物体类别(如广告、横幅和广告牌)混淆。其次,反射、低光照条件、损坏和遮挡会影响交通标志分类的性能。第三,具有小类间差异的细粒度分类并非易事。第四,大多数交通标志在街景图像中出现时相对较小,这要求高效的小物体架构设计。此外,由于全球交通标志类别的多样性,建立一个完整且通用的交通标志分类体系仍然是一个挑战。
常用场景
经典使用场景
Mapillary Traffic Sign Dataset (MTSD) 作为交通标志检测和分类的全球规模基准数据集,其经典使用场景主要集中于自动驾驶和智能城市领域。该数据集包含来自世界各地的100K街景图像,涵盖了多样的场景、广泛的地理位置、以及不同的天气和光照条件,并包含超过300个手动标注的交通标志类别。MTSD 数据集的规模和多样性为研究人员提供了丰富的数据资源,用于开发和测试交通标志检测和分类算法,从而推动自动驾驶和智能交通系统的发展。
实际应用
MTSD 数据集在实际应用场景中具有广泛的应用价值。在自动驾驶领域,MTSD 可用于开发和测试交通标志检测和分类算法,从而提高自动驾驶车辆对交通标志的识别准确性和鲁棒性。此外,MTSD 也可用于智能交通系统,如交通流量监控、交通信号控制等,从而提高交通系统的效率和安全性。MTSD 数据集的多样性和广泛性使得其在实际应用中具有更高的实用价值。
衍生相关工作
MTSD 数据集的发布引发了众多相关研究工作的开展。例如,一些研究工作利用 MTSD 数据集进行交通标志检测和分类算法的开发和测试,并取得了显著的成果。此外,MTSD 数据集也促进了迁移学习在交通标志识别领域的应用,研究人员可以利用该数据集在其他大规模基准数据集上进行迁移学习,从而提高算法的性能。此外,MTSD 数据集也为交通标志识别技术的发展提供了新的研究方向,如零样本学习、层次分类等,有助于推动交通标志识别技术的发展。
以上内容由AI搜集并总结生成



