MVTD

Hugging Face2026-02-05 更新2026-02-07 收录

下载链接：

https://huggingface.co/datasets/AhsanBB/MVTD

下载链接

链接失效反馈

官方服务：

资源简介：

MVTD（Maritime Visual Tracking Dataset）是一个专门为海上环境中的单目标视觉跟踪（VOT）设计的大规模基准数据集。该数据集解决了海上场景特有的挑战，如水反射、低对比度物体、动态背景、尺度变化和严重的光照变化，这些在通用跟踪数据集中未得到充分覆盖。数据集包含182个标注的视频序列，约150,000帧，涵盖四种海上物体类别：小船、船舶、帆船和无人水面艇（USV）。MVTD适用于在真实海上条件下训练、微调和基准测试视觉目标跟踪算法。数据集遵循GOT-10k单目标跟踪格式，便于与现有跟踪流程集成。每个视频序列使用九种跟踪属性进行分类，包括遮挡、光照变化、尺度变化等。数据通过岸上静态相机和海上动态相机收集，覆盖了海岸监视、港口监控和公海船只跟踪等多种海上场景。数据集支持两种评估协议：预训练评估和微调评估，并已使用14种最先进的视觉跟踪器进行基准测试。

MVTD (Maritime Visual Tracking Dataset) is a large-scale benchmark dataset specifically designed for single-object visual tracking (VOT) in maritime environments. This dataset addresses the unique challenges inherent in maritime scenarios, including water reflections, low-contrast objects, dynamic backgrounds, scale variations, and severe illumination changes, which are insufficiently covered in general tracking datasets. The dataset comprises 182 annotated video sequences with approximately 150,000 frames, covering four maritime object categories: small boats, ships, sailboats, and unmanned surface vehicles (USV). MVTD is suitable for training, fine-tuning, and benchmarking visual object tracking algorithms under real-world maritime conditions. The dataset follows the GOT-10k single-object tracking format, facilitating integration with existing tracking pipelines. Each video sequence is categorized using nine tracking attributes, including occlusion, illumination changes, scale variations, and others. The data is collected via both shore-based static cameras and on-sea dynamic cameras, covering various maritime scenarios such as coastal surveillance, port monitoring, and open-sea vessel tracking. The dataset supports two evaluation protocols: pre-trained evaluation and fine-tuned evaluation, and has been benchmarked using 14 state-of-the-art visual trackers.

创建时间：

2026-01-29

搜集汇总

数据集介绍

构建方式

在海洋视觉追踪领域，数据集的构建需精准捕捉复杂环境下的动态特征。MVTD通过双相机系统采集数据，其中岸基静态相机记录了大尺度变化与透视畸变，而搭载于无人水面艇的动态相机则捕捉了强烈光照变化与运动模糊。采集场景覆盖了海岸监视、港口监控及开阔海域追踪等多种典型环境，确保了数据在空间与时间维度上的广泛代表性。所有视频序列均经过人工标注，严格遵循GOT-10k单目标追踪格式，为算法训练与评估提供了结构化基础。

特点

该数据集的核心特点在于其针对海洋环境特有的挑战进行了系统化设计。它包含了182个视频序列，约15万帧高分辨率图像，涵盖船只、船舶、帆船及无人水面艇四类目标。每个序列均标注了九种追踪属性，如遮挡、光照变化、尺度变化等，这些属性既体现了海洋场景的独特性，也兼顾了通用视觉追踪的难点。数据集的帧率与分辨率范围广泛，平均序列长度约824帧，能够有效模拟真实海洋环境中目标的长时间动态行为。

使用方法

使用MVTD时，研究者可依据其提供的两种评估协议灵活开展实验。协议一直接使用在通用数据集上预训练的追踪器进行测试，以评估模型在海洋环境中的泛化能力；协议二则允许利用训练集对追踪器进行微调，再于测试集上验证领域适应效果。数据集已集成基准评估脚本，支持与现有追踪流程无缝对接。通过访问官方GitHub仓库，用户可获取详细的实现代码与基线配置，便于复现实验或开发新算法。

背景与挑战

背景概述

在计算机视觉领域，单目标视觉跟踪技术是视频分析与理解的核心任务之一，其旨在连续帧中定位并追踪指定目标。然而，传统跟踪数据集多聚焦于通用场景，难以应对海事环境特有的复杂挑战。MVTD数据集由Ahsan Baidar Bakht等研究人员于2025年创建，专门针对海事场景中的单目标跟踪问题，涵盖了船舶、帆船、无人水面艇等四类海事目标。该数据集通过岸基静态摄像头与船载动态摄像头采集，包含182个视频序列与约15万帧标注图像，旨在填补海事跟踪领域的数据空白，为算法训练、微调与评估提供标准化基准，推动海事监控、自主导航等应用的发展。

当前挑战

MVTD数据集致力于解决海事环境中单目标视觉跟踪的领域挑战，这些挑战包括水面反光、低对比度目标、动态背景干扰、尺度剧烈变化以及光照突变等复杂因素，这些因素在通用数据集中往往未被充分涵盖，导致现有跟踪模型在海事场景下性能显著下降。在构建过程中，数据采集面临双重困难：一方面，岸基摄像头需处理大规模尺度变化与透视畸变，同时应对船只与结构的遮挡问题；另一方面，船载动态摄像头受到强烈光照变化、运动模糊与振动干扰，且视角快速切换，增加了数据标注的连续性与准确性难度。此外，数据集需平衡九种跟踪属性以全面反映海事与通用跟踪挑战，这对序列选择与标注质量控制提出了更高要求。

常用场景

经典使用场景

在海洋视觉感知领域，MVTD数据集为单目标视觉跟踪算法的训练与评估提供了关键基准。其经典使用场景集中于模拟真实海事环境下的目标追踪任务，涵盖海岸监控、港口监测与开阔海域船只跟踪等多种情境。研究者利用该数据集训练模型以应对水面反射、低对比度目标、动态背景及剧烈光照变化等特有挑战，从而系统检验算法在复杂海洋场景中的鲁棒性与准确性。

衍生相关工作

围绕MVTD数据集，已衍生出一系列聚焦海事视觉跟踪的经典研究工作。多篇学术论文基于该数据集的两种评估协议，对比了孪生网络、Transformer与自回归模型等先进跟踪器的性能，揭示了领域专用数据对模型泛化能力的关键影响。这些研究不仅推动了针对光照变化、低对比度目标等海事挑战的算法优化，也为后续海洋环境下的多目标跟踪与跨模态感知研究提供了重要参考。

数据集最近研究