Maritime_Visual_Tracking_Dataset_MVTD

Hugging Face2026-03-11 更新2026-03-12 收录

下载链接：

https://huggingface.co/datasets/othmaneirl/Maritime_Visual_Tracking_Dataset_MVTD

下载链接

链接失效反馈

官方服务：

资源简介：

MVTD（Maritime Visual Tracking Dataset）是一个专门为海上环境中的单目标视觉跟踪（VOT）设计的大规模基准数据集。该数据集解决了海上场景特有的挑战，如水面反射、低对比度目标、动态背景、尺度变化和严重的光照变化，这些在通用跟踪数据集中未得到充分覆盖。数据集包含182个标注的视频序列，约150,000帧，涵盖四种海上目标类别：船只、轮船、帆船和无人水面艇（USV）。MVTD采用GOT-10k单目标跟踪格式，便于与现有跟踪流程集成。每个视频序列通过九种跟踪属性进行分类，包括遮挡、光照变化、尺度变化、运动模糊等。数据集通过两种互补的相机设置（岸上静态相机和海上动态相机）收集，覆盖了海岸监视、港口监控和公海船只跟踪等多种海上场景。MVTD支持两种评估协议：预训练评估和微调评估，并已用14种最先进的视觉跟踪器进行了基准测试。该数据集适用于单目标视觉跟踪、领域适应和迁移学习、海上机器人及自主导航，以及在海上条件下对跟踪算法进行基准测试。

创建时间：

2026-03-06

原始信息汇总

MVTD: 海事视觉跟踪数据集概述

数据集简介

MVTD（Maritime Visual Tracking Dataset）是一个专为海事环境下的单目标视觉跟踪设计的大规模基准数据集。它旨在解决海事场景特有的挑战，如水面反光、低对比度目标、动态背景、尺度变化和剧烈光照变化，这些挑战在通用跟踪数据集中未被充分涵盖。

基本统计

视频序列总数： 182
标注帧总数： 150,058
帧率： 30 FPS 和 60 FPS
分辨率范围：
- 最小：1024 × 1024
- 最大：1920 × 1440
平均序列长度： 约824帧
序列长度范围： 82 – 4747帧
目标类别： 4

目标类别

数据集涵盖以下四个海事目标类别：

船只
轮船
帆船
无人水面艇

数据结构

数据集遵循GOT-10k单目标跟踪格式，便于与现有跟踪流程集成。主要目录结构包含train和test两个文件夹，每个视频序列文件夹内包含帧图像文件（如frame0001.jpg）以及标注文件（如groundtruth.txt、absence.label、cut_by_image.label、cover.label）。

跟踪属性

每个视频序列使用九个跟踪属性进行标注：

遮挡
光照变化
尺度变化
运动模糊
外观变化
部分可见
低分辨率
背景杂乱
低对比度目标这些属性代表了海事特定和通用的视觉跟踪挑战。

数据采集

数据通过两种互补的相机设置采集：

岸上静态相机： 涵盖大尺度变化、透视畸变、以及来自船只和结构的遮挡。
安装在USV上的离岸动态相机： 涵盖强光照变化和眩光、运动模糊和振动、快速视角变化。采集场景覆盖了海岸监视、港口监控、公海船只跟踪等多种海事场景。

评估协议

数据集支持两种评估设置：

协议 I – 预训练评估： 使用在通用目标跟踪数据集上预训练的跟踪器，直接在MVTD测试集上评估，衡量其在海事环境中的泛化性能。
协议 II – 微调评估： 使用MVTD训练集微调跟踪器，然后在MVTD测试集上评估，衡量针对海事跟踪的领域适应有效性。详细的实现、评估脚本和基线跟踪器配置请访问官方GitHub仓库：https://github.com/AhsanBaidar/MVTD。

基线结果

数据集已使用14种先进的视觉跟踪器（包括基于Siamese、Transformer和自回归的模型）进行基准测试。结果显示，使用通用预训练跟踪器时性能显著下降，而经过微调后性能大幅提升，这突显了海事特定数据的重要性。

预期用途

该数据集适用于：

单目标视觉跟踪
领域适应和迁移学习
海事机器人和自主导航
海事条件下跟踪算法的基准测试

引用信息

如果使用本数据集，请引用： bibtex @article{bakht2025mvtd, title={MVTD: A Benchmark Dataset for Maritime Visual Object Tracking}, author={Bakht, Ahsan Baidar and Din, Muhayy Ud and Javed, Sajid and Hussain, Irfan}, journal={arXiv preprint arXiv:2506.02866}, year={2025} }

许可信息

数据集采用CC0 1.0许可协议。

规模类别

数据集规模类别为100K<n<1M。

搜集汇总

数据集介绍

构建方式

在海洋视觉追踪领域，数据集的构建需精准捕捉复杂环境下的动态特征。MVTD数据集通过双相机系统采集，结合岸基静态摄像头与搭载于无人水面艇的动态摄像头，覆盖了从海岸监视到开阔海域的多样化场景。视频序列以30至60帧每秒的速率录制，分辨率介于1024×1024至1920×1440之间，最终形成包含182个序列、约15万帧的标注数据，并严格遵循GOT-10k单目标追踪格式进行组织。

特点

该数据集的核心特点在于其针对海洋环境特有的挑战进行了系统化设计。它不仅涵盖了船只、船舶、帆船及无人水面艇四类目标，还为每个序列标注了九种追踪属性，包括遮挡、光照变化、尺度变异等，这些属性既体现了海洋场景的独特性，如低对比度物体和水面反射，也兼顾了通用视觉追踪的难点。序列平均长度约824帧，最长可达4747帧，确保了数据在时间维度上的丰富性与连续性。

使用方法

MVTD数据集的使用主要围绕两种评估协议展开。研究者可直接将预训练于通用数据集的追踪器应用于测试集，以评估其在海洋环境中的泛化能力；亦可通过训练集进行微调，进而测试领域适应效果。数据集结构清晰，支持与现有追踪流程无缝集成，用户可借助官方GitHub仓库提供的评估脚本与基线配置，便捷地开展算法训练、微调与性能基准测试。

背景与挑战

背景概述

海事视觉跟踪数据集（MVTD）由Ahsan Baidar Bakht等研究人员于2025年构建，旨在应对海事环境中单目标视觉跟踪的独特挑战。该数据集聚焦于海岸监控、港口监测及公海船只跟踪等实际应用场景，通过岸基静态摄像头与搭载于无人水面艇的动态摄像头互补采集，涵盖了182个视频序列约15万帧图像，包含船只、船舶、帆船及无人水面艇四类海事目标。其创建填补了通用跟踪数据集在海事领域适应性不足的空白，为海事机器人学、自主导航及领域自适应研究提供了关键基准资源，推动了视觉跟踪技术向专业化场景的深化发展。

当前挑战

MVTD致力于解决海事环境下单目标视觉跟踪的核心难题，包括水面反光、低对比度目标、动态背景干扰、剧烈光照变化及尺度变异等复杂条件，这些挑战在通用数据集中往往未被充分涵盖。在数据集构建过程中，研究人员面临双重困难：一方面需克服海事场景数据采集的物理限制，如摄像机振动、运动模糊及视角快速变化；另一方面，标注工作必须精确处理目标部分可见、遮挡及外观变异等属性，确保标注质量能真实反映海事跟踪的严峻考验。

常用场景

经典使用场景

在海洋视觉跟踪领域，MVTD数据集作为专门针对海上单目标视觉跟踪任务的大规模基准，其经典使用场景聚焦于算法在复杂海事环境下的性能评估与优化。该数据集通过涵盖船只、帆船、船舶及无人水面艇等四类目标，并模拟了水反射、低对比度物体、动态背景及剧烈光照变化等真实挑战，为研究者提供了训练、微调和基准测试的统一平台，有效推动了跟踪模型在海岸监控、港口管理等场景中的鲁棒性提升。

实际应用

在实际应用层面，MVTD数据集直接服务于海洋安全与自主航行系统的开发。其数据采集结合了岸基静态相机与船载动态相机，覆盖了沿海监视、海港监测及开阔海域船舶跟踪等多种真实场景。基于该数据集训练的跟踪算法可集成于无人水面艇或监控平台，实现目标持续定位与行为分析，显著提升海上搜救、交通管理及边境管控等任务的自动化水平与响应效率。

衍生相关工作

围绕MVTD数据集，已衍生出一系列经典研究工作，主要集中在海事视觉跟踪的算法改进与评估框架构建。例如，研究者利用该数据集对包括孪生网络、Transformer及自回归模型在内的14种先进跟踪器进行基准测试，揭示了预训练模型在跨领域迁移中的性能局限，并验证了微调策略的有效性。这些工作不仅推动了跟踪技术在海事领域的专用化发展，也为后续多模态融合、实时跟踪系统设计等方向提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集