five

Mapillary Traffic Sign Dataset (MTSD)|自动驾驶数据集|交通标志识别数据集

收藏
arXiv2020-05-07 更新2024-07-25 收录
自动驾驶
交通标志识别
下载链接:
https://www.mapillary.com/dataset/trafficsign
下载链接
链接失效反馈
资源简介:
Mapillary Traffic Sign Dataset (MTSD) 是由Mapillary研究机构创建的大型交通标志数据集,包含来自全球的100,000张街景图像,涵盖了多样化的场景、广泛的地理位置覆盖以及不同的天气和光照条件。数据集详细标注了超过300种交通标志类别,其中52,000张图像完全标注,48,000张图像部分标注。MTSD旨在为自动驾驶和智能城市时代提供准确的交通标志检测和分类算法,通过广泛的实验建立了强大的基准,并验证了该数据集在现有大规模基准数据集上的有效迁移学习能力。
提供机构:
Mapillary
创建时间:
2019-09-10
AI搜集汇总
数据集介绍
main_image_url
构建方式
Mapillary Traffic Sign Dataset (MTSD) 是通过从全球范围内收集街景图像,并对这些图像进行精细标注而构建的。数据集的构建过程分为三个主要步骤:图像选择、标注过程和数据集分割。图像选择阶段采用贪婪策略,确保了图像在全球范围内的均匀分布,覆盖了不同质量、不同条件下的图像。标注过程则由15位专家进行,分为图像审核、标志定位和标志分类三个连续的任务,每个任务都有其自身的质量控制流程。数据集被分割成训练集、验证集和测试集,以匹配图像的分布,并确保每个数据集都包含相似数量的类实例。
特点
MTSD 的特点包括:1) 全世界范围内收集的100K张街景图像,涵盖了超过300个手动标注的交通标志类别;2) 包括52K张完全标注的图像和48K张部分标注的图像,为交通标志检测和分类任务提供了大量的数据;3) 数据集覆盖了不同的场景、地理位置、天气和光照条件,使得数据集具有很高的多样性;4) 提供了部分标注的图像集,为半监督学习研究提供了数据源。
使用方法
MTSD 的使用方法如下:1) 下载数据集:可以从Mapillary的官方网站免费下载MTSD数据集;2) 数据预处理:根据研究需求对图像进行预处理,例如缩放、裁剪等;3) 模型训练:使用MTSD数据集对模型进行训练,可以选择使用Faster R-CNN、ResNet等模型;4) 模型评估:使用验证集对模型进行评估,评估指标包括平均精确度(AP)、平均准确率(mAP)等;5) 模型应用:将训练好的模型应用于实际场景,例如自动驾驶、智能交通等。
背景与挑战
背景概述
交通标志作为全球自主驾驶和智慧城市时代的关键地图特征,对于交通导航、交通控制和道路安全至关重要。为了开发准确和鲁棒的交通标志检测和分类算法,需要一个大规模且多样化的基准数据集。Mapillary Traffic Sign Dataset (MTSD) 是一个包含全球范围内 10 万张街景图像的数据集,这些图像涵盖了多样化的场景、广泛的地理位置、以及变化的天气和光照条件,并涵盖了 300 多个手动注释的交通标志类别。该数据集包括 52K 张完全注释的图像和 48K 张部分注释的图像,是迄今为止最大、最多样化的交通标志数据集,包括来自世界各地的图像,并具有对交通标志类别的细粒度注释。研究人员进行了广泛的实验,为检测和分类任务建立了强大的基线,并验证了该数据集的多样性能够有效促进现有大规模基准数据集上的交通标志检测和分类的迁移学习。
当前挑战
尽管 MTSD 数据集在交通标志检测和分类方面取得了显著的进展,但仍面临一些挑战。首先,交通标志在街道场景中容易与其他物体类别(如广告、横幅和广告牌)混淆。其次,反射、低光照条件、损坏和遮挡会影响交通标志分类的性能。第三,具有小类间差异的细粒度分类并非易事。第四,大多数交通标志在街景图像中出现时相对较小,这要求高效的小物体架构设计。此外,由于全球交通标志类别的多样性,建立一个完整且通用的交通标志分类体系仍然是一个挑战。
常用场景
经典使用场景
Mapillary Traffic Sign Dataset (MTSD) 作为交通标志检测和分类的全球规模基准数据集,其经典使用场景主要集中于自动驾驶和智能城市领域。该数据集包含来自世界各地的100K街景图像,涵盖了多样的场景、广泛的地理位置、以及不同的天气和光照条件,并包含超过300个手动标注的交通标志类别。MTSD 数据集的规模和多样性为研究人员提供了丰富的数据资源,用于开发和测试交通标志检测和分类算法,从而推动自动驾驶和智能交通系统的发展。
实际应用
MTSD 数据集在实际应用场景中具有广泛的应用价值。在自动驾驶领域,MTSD 可用于开发和测试交通标志检测和分类算法,从而提高自动驾驶车辆对交通标志的识别准确性和鲁棒性。此外,MTSD 也可用于智能交通系统,如交通流量监控、交通信号控制等,从而提高交通系统的效率和安全性。MTSD 数据集的多样性和广泛性使得其在实际应用中具有更高的实用价值。
衍生相关工作
MTSD 数据集的发布引发了众多相关研究工作的开展。例如,一些研究工作利用 MTSD 数据集进行交通标志检测和分类算法的开发和测试,并取得了显著的成果。此外,MTSD 数据集也促进了迁移学习在交通标志识别领域的应用,研究人员可以利用该数据集在其他大规模基准数据集上进行迁移学习,从而提高算法的性能。此外,MTSD 数据集也为交通标志识别技术的发展提供了新的研究方向,如零样本学习、层次分类等,有助于推动交通标志识别技术的发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

Nexdata/chinese_dialect

该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。

hugging_face 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录