Maritime_Visual_Tracking_Dataset_MVTD
收藏MVTD: 海事视觉跟踪数据集概述
数据集简介
MVTD(Maritime Visual Tracking Dataset)是一个专为海事环境下的单目标视觉跟踪设计的大规模基准数据集。它旨在解决海事场景特有的挑战,如水面反光、低对比度目标、动态背景、尺度变化和剧烈光照变化,这些挑战在通用跟踪数据集中未被充分涵盖。
基本统计
- 视频序列总数: 182
- 标注帧总数: 150,058
- 帧率: 30 FPS 和 60 FPS
- 分辨率范围:
- 最小:1024 × 1024
- 最大:1920 × 1440
- 平均序列长度: 约824帧
- 序列长度范围: 82 – 4747帧
- 目标类别: 4
目标类别
数据集涵盖以下四个海事目标类别:
- 船只
- 轮船
- 帆船
- 无人水面艇
数据结构
数据集遵循GOT-10k单目标跟踪格式,便于与现有跟踪流程集成。主要目录结构包含train和test两个文件夹,每个视频序列文件夹内包含帧图像文件(如frame0001.jpg)以及标注文件(如groundtruth.txt、absence.label、cut_by_image.label、cover.label)。
跟踪属性
每个视频序列使用九个跟踪属性进行标注:
- 遮挡
- 光照变化
- 尺度变化
- 运动模糊
- 外观变化
- 部分可见
- 低分辨率
- 背景杂乱
- 低对比度目标 这些属性代表了海事特定和通用的视觉跟踪挑战。
数据采集
数据通过两种互补的相机设置采集:
- 岸上静态相机: 涵盖大尺度变化、透视畸变、以及来自船只和结构的遮挡。
- 安装在USV上的离岸动态相机: 涵盖强光照变化和眩光、运动模糊和振动、快速视角变化。 采集场景覆盖了海岸监视、港口监控、公海船只跟踪等多种海事场景。
评估协议
数据集支持两种评估设置:
- 协议 I – 预训练评估: 使用在通用目标跟踪数据集上预训练的跟踪器,直接在MVTD测试集上评估,衡量其在海事环境中的泛化性能。
- 协议 II – 微调评估: 使用MVTD训练集微调跟踪器,然后在MVTD测试集上评估,衡量针对海事跟踪的领域适应有效性。 详细的实现、评估脚本和基线跟踪器配置请访问官方GitHub仓库:https://github.com/AhsanBaidar/MVTD。
基线结果
数据集已使用14种先进的视觉跟踪器(包括基于Siamese、Transformer和自回归的模型)进行基准测试。结果显示,使用通用预训练跟踪器时性能显著下降,而经过微调后性能大幅提升,这突显了海事特定数据的重要性。
预期用途
该数据集适用于:
- 单目标视觉跟踪
- 领域适应和迁移学习
- 海事机器人和自主导航
- 海事条件下跟踪算法的基准测试
引用信息
如果使用本数据集,请引用: bibtex @article{bakht2025mvtd, title={MVTD: A Benchmark Dataset for Maritime Visual Object Tracking}, author={Bakht, Ahsan Baidar and Din, Muhayy Ud and Javed, Sajid and Hussain, Irfan}, journal={arXiv preprint arXiv:2506.02866}, year={2025} }
许可信息
数据集采用CC0 1.0许可协议。
规模类别
数据集规模类别为100K<n<1M。



