five

Mapillary Vistas Validation for Traffic Signs (MVV)

收藏
arXiv2025-08-04 更新2025-08-06 收录
下载链接:
https://github.com/nec-labs-ma/relabeling
下载链接
链接失效反馈
官方服务:
资源简介:
Mapillary Vistas Validation for Traffic Signs (MVV)数据集是从Mapillary Vistas数据集中衍生出来的,包含2000张高分辨率街景图像,由专家标注员对交通标志进行了11个细粒度语义类别的标注。该数据集支持物体检测和实例分割任务,可用于评估自动驾驶场景下的视觉识别模型在细粒度语义识别方面的性能。数据集的创建旨在解决自动驾驶中细粒度交通标志识别的挑战,并为更可靠、可解释和可扩展的感知提供途径。

The Mapillary Vistas Validation for Traffic Signs (MVV) dataset is derived from the Mapillary Vistas dataset. It contains 2000 high-resolution street view images, with traffic signs annotated into 11 fine-grained semantic categories by expert annotators. This dataset supports both object detection and instance segmentation tasks, and can be utilized to evaluate the performance of visual recognition models on fine-grained semantic recognition in autonomous driving scenarios. The dataset was developed to address the challenges of fine-grained traffic sign recognition in autonomous driving, and to provide pathways for more reliable, interpretable and scalable autonomous driving perception systems.
提供机构:
美国NEC实验室
创建时间:
2025-08-04
原始信息汇总

Relabeled Mapillary Traffic Sign Validation Dataset (2000 Images) 数据集概述

数据集简介

  • 数据来源:基于Mapillary数据集的2000张验证图像
  • 标注类型:交通标志的重新标注
  • 标注方式:人工标注结合视觉语言模型(VLMs)辅助
  • 应用领域:自动驾驶、城市场景理解

数据集内容

  • 图像数量:2000张
  • 标注类别:12类交通标志
    • 停车标志
    • 限速标志
    • 让行标志
    • 禁止进入标志
    • 人行横道标志
    • 停车许可标志
    • 禁止停车标志
    • 环岛标志
    • 转向标志
    • 自行车道标志
    • 其他标志

数据获取

  • 图像下载
    • https://mapillary-signs.s3.us-west-2.amazonaws.com/images.zip
    • 或使用AWS CLI: aws s3 cp s3://mapillary-signs/images.zip .
  • 标注下载
    • https://mapillary-signs.s3.us-west-2.amazonaws.com/instances_default.json
    • 或使用AWS CLI: aws s3 cp s3://mapillary-signs/instances_default.json .

技术支持

  • 使用的视觉语言模型
    • InternVL系列模型
    • Gemma系列模型
  • 支持的任务
    • Mapillary车辆标注
    • Mapillary行人标注
    • Mapillary交通标志标注
    • BDD车辆标注

附加功能

  • 分类器重标注
    • 支持ResNet50/ResNet101模型
    • 包含训练和推理脚本
  • 外部数据集成
    • 支持Roboflow和Object365数据集
    • 提供DINOv2特征提取功能

使用限制

  • 许可:仅限研究和学术用途
  • 详细许可:需查看LICENSE.txt文件

联系方式

  • 电子邮件:sparsh@nec-labs.com
  • LinkedIn:linkedin.com/in/garg-sparsh
搜集汇总
数据集介绍
main_image_url
构建方式
Mapillary Vistas Validation for Traffic Signs (MVV) 数据集基于Mapillary Vistas数据集构建,通过专家手动标注将原始粗粒度交通标志标签细化为11个具有语义意义的类别。该数据集包含2000张高分辨率街景图像,每张图像均提供像素级实例掩码,确保了标注的精确性和可靠性。构建过程中,研究团队随机选取Mapillary Vistas验证集中的图像,并利用原始实例掩码进行语义细化,保留了空间分割信息的同时提升了语义粒度。
特点
MVV数据集的核心特点在于其细粒度的语义标注和全局地理覆盖。该数据集将交通标志分解为包括停车标志、限速标志、让行标志等在内的11个语义类别,弥补了现有数据集中语义信息不足的缺陷。此外,数据集支持实例分割和目标检测任务,并涵盖了复杂城市场景中的遮挡、截断和多尺度挑战,为自动驾驶场景下的细粒度视觉理解提供了可靠的评估基准。值得注意的是,数据集标注经过专家验证,确保了标注质量,且地理覆盖范围广泛,增强了模型的泛化能力。
使用方法
MVV数据集主要用于评估自动驾驶场景下细粒度交通标志识别的性能。研究者可通过该数据集对视觉语言模型(VLMs)和自监督模型(如DINOv2)进行基准测试,比较其在密集语义匹配任务中的表现。使用时可加载像素级标注进行实例分割或目标检测任务,亦可通过提供的语义类别进行细粒度分类评估。为充分发挥数据集价值,建议结合外部开源数据集(如Object365)进行特征提取和相似性匹配,以验证模型在真实驾驶场景中的识别能力。数据集的评估指标以分类准确率为主,适用于对比不同模型在安全关键感知任务中的性能差异。
背景与挑战
背景概述
Mapillary Vistas Validation for Traffic Signs (MVV) 数据集由Sparsh Garg和Abhishek Aich等研究人员于2025年提出,旨在解决自动驾驶领域中交通标志细粒度识别的关键问题。该数据集基于Mapillary Vistas数据集,通过专家手动标注,将原本粗粒度的交通标志标签细分为11类具有语义意义的类别,如停车标志、限速标志等。MVV数据集的推出填补了现有数据集在语义细粒度上的不足,为自动驾驶系统的安全决策提供了更可靠的视觉理解基准。
当前挑战
MVV数据集面临的挑战主要体现在两个方面:一是领域问题的挑战,即细粒度交通标志识别本身存在的困难,如交通标志尺寸小、易被遮挡、远距离放置等问题;二是构建过程中的挑战,包括从粗粒度标签到细粒度标签的转换、专家标注的一致性和准确性保证,以及数据集中各类别样本不平衡等问题。这些挑战使得细粒度交通标志识别成为自动驾驶视觉理解中的一个难点,也凸显了MVV数据集在此领域的重要价值。
常用场景
经典使用场景
在自动驾驶领域,交通标志的精细识别是确保行车安全的关键环节。Mapillary Vistas Validation for Traffic Signs (MVV) 数据集通过提供11种语义细分的交通标志类别,包括停车标志、限速标志、让行标志等,为研究者们构建了一个高精度的基准测试平台。该数据集特别适用于评估视觉语言模型(VLMs)和自监督模型在复杂城市场景下对小型、遮挡或远距离交通标志的识别能力,填补了现有数据集中语义粒度不足的空白。
解决学术问题
MVV数据集主要解决了自动驾驶研究中两个核心问题:一是传统数据集中交通标志标注过于粗糙(如仅区分正反面)导致的语义信息缺失问题;二是现有视觉语言模型在细粒度分类任务上的性能局限。通过专家手动标注的像素级实例掩码,该数据集为验证模型在密集语义匹配任务中的表现提供了可靠依据,并揭示了DINOv2等自监督模型相对于VLMs在空间定位和类别区分上的显著优势。
衍生相关工作
MVV数据集的发布催生了一系列关于细粒度视觉理解的研究。基于其基准结果,后续工作如《DINOv2 for Autonomous Signage Interpretation》进一步探索了自监督特征在交通标志识别中的迁移学习机制;而《PromptCraft for VLM Traffic Sign Recognition》则针对VLMs的提示策略进行优化。这些衍生研究共同推动了自动驾驶感知技术向更安全、更可解释的方向发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作