five

Video SAR MOT Benchmark (VSMB)

收藏
arXiv2025-06-13 更新2025-06-19 收录
下载链接:
https://github.com/softwarePupil/VSMB
下载链接
链接失效反馈
资源简介:
VSMB数据集是首个公开的视频合成孔径雷达目标跟踪数据集,由北京航空航天大学电子与信息工程学院的研究团队收集和标注。数据集包含45个视频序列,共4,394张图像,涵盖25,466个目标实例和355条轨迹。VSMB旨在解决视频合成孔径雷达目标跟踪中的多普勒失配、尾迹和散焦效应等问题。数据集涵盖了机场、港口、城市和矿区等场景,为未来研究提供了统一和有价值的基准。

The VSMB dataset is the first publicly available video synthetic aperture radar (Video SAR) object tracking dataset, collected and annotated by the research team from the School of Electronic and Information Engineering, Beihang University. The dataset consists of 45 video sequences, totaling 4,394 images, covering 25,466 target instances and 355 trajectories. The VSMB dataset aims to address issues such as Doppler mismatch, wake and defocusing effects in video SAR object tracking. The dataset covers scenarios including airports, ports, urban areas and mining areas, providing a unified and valuable benchmark for future research.
提供机构:
北京航空航天大学电子与信息工程学院
创建时间:
2025-06-13
AI搜集汇总
数据集介绍
main_image_url
构建方式
在视频合成孔径雷达(Video SAR)多目标跟踪领域,VSMB数据集的构建采用了系统化的数据采集与标注流程。研究团队从ICEYE、SNL等公开平台获取了涵盖机场、港口、矿区等典型场景的45段视频SAR序列,通过DOTA-devkit工具将大尺寸图像分割为1024×1024的标准化切片。为确保数据多样性,采用视频回放策略进行训练集扩增,并严格遵循多目标跟踪标注标准,使用DarkLabel工具进行逐帧精细化标注。针对SAR影像特有的多普勒频移伪影问题,数据集创新性地引入线特征增强机制,有效区分运动目标阴影与静态遮挡干扰。
特点
VSMB作为首个公开的视频SAR多目标跟踪基准数据集,包含25,466个车辆、船舶及飞机目标实例,构成355条完整轨迹。其核心特征体现在三个方面:首先,数据覆盖0.1-15米多分辨率影像,精准呈现目标因多普勒失配导致的散焦拖尾效应;其次,通过运动阴影特征标注强化了动态目标与静态障碍物的可区分性;最后,数据集提供严格划分的训练/验证集,并附带基线模型性能指标,为算法评估建立标准化体系。特别值得注意的是,目标尺寸呈现长尾分布,其中90%的实例属于大尺度目标,这对模型的多尺度适应能力提出更高要求。
使用方法
使用VSMB数据集需遵循视频SAR任务的特殊处理流程。研究者应首先对原始序列进行通道维度的时序拼接,构建时空连续的输入张量。基准流程推荐采用Dino检测器与ByteTrack跟踪器组成的DBT框架,其中检测阶段需集成线特征聚焦模块(LFFM)处理散焦伪影,关联阶段则通过运动感知机制(MaA)动态调整外观相似度权重。评估时需重点关注MOTA、IDF1等指标,特别注意由多普勒效应导致的虚警率(FP)和轨迹碎片化(IDSW)问题。数据集官网提供标准评估脚本及基线模型代码,支持端到端的算法验证与性能对比。
背景与挑战
背景概述
Video SAR MOT Benchmark (VSMB) 是由北京航空航天大学电子与信息工程学院的陈浩翔、赵伟等研究人员于2025年提出的首个公开视频合成孔径雷达多目标跟踪基准数据集。该数据集包含45个视频序列,涵盖机场、港口、矿区等多种典型场景,共标注25,466个目标实例和355条轨迹。VSMB的建立填补了视频SAR领域缺乏标准化评估基准的空白,为复杂环境下动态目标跟踪研究提供了重要实验平台。其创新性地利用目标运动引起的多普勒频移特征,通过线特征增强机制区分静态遮挡与运动阴影,显著提升了跟踪算法的鲁棒性。
当前挑战
VSMB数据集主要解决视频SAR中多目标跟踪的两大核心挑战:一是运动目标多普勒失配导致的方位向拖尾效应,造成散射点特征在阴影与散射体间频繁转换,引发关联失败与轨迹断裂;二是雷达波束遮挡产生的静态阴影与运动目标阴影难以区分,导致检测虚警率升高。在数据集构建过程中,研究人员面临标注一致性维护的挑战,需精确区分动态目标与静态人造物阴影。此外,视频SAR特有的目标外观变化问题,要求标注过程充分考虑多普勒效应引起的图像模糊和形变特征。
常用场景
经典使用场景
在视频合成孔径雷达(Video SAR)领域,多目标跟踪(MOT)面临的主要挑战包括目标运动引起的多普勒频移导致的伪影干扰以及目标外观变化引起的关联失败。VSMB数据集通过提供45个包含移动目标的视频SAR序列,为研究者提供了一个标准化的评估基准。该数据集特别强调了对运动阴影和静态遮挡的区分,通过引入线特征增强机制,显著提升了跟踪算法的鲁棒性。
实际应用
VSMB数据集在边境巡逻、海上监控等实际场景中具有重要应用价值。其提供的视频SAR数据覆盖机场、港口、矿区等多种典型场景,能够有效支持复杂环境下的动态信息获取。数据集中提出的线特征增强和运动感知技术,可显著降低静态遮挡导致的误报率,提升监控系统的可靠性和效率。
衍生相关工作
VSMB数据集的发布推动了视频SAR目标跟踪领域的多项经典工作。基于该数据集,研究者提出了多种改进算法,如结合时空线索的图神经网络关联模型、跨帧能量检测方法以及运动阴影特征增强技术。这些工作进一步优化了目标检测和跟踪的鲁棒性,为后续研究提供了重要参考。
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作