LaTOT

Name: LaTOT
Creator: 安徽大学
Published: 2022-02-11 23:00:32
License: 暂无描述

arXiv2022-02-11 更新2024-06-21 收录

下载链接：

https://github.com/mmic-lcl/Datasets-andbenchmark-code

下载链接

链接失效反馈

官方服务：

资源简介：

LaTOT是由安徽大学创建的大规模视频数据集，专注于微小目标跟踪。该数据集包含434个视频序列，总计超过21.7万帧，每帧都经过高质量边界框标注。数据集考虑了12种挑战属性，以覆盖广泛的视角和场景复杂性，旨在促进基于属性的性能分析。LaTOT不仅推动了微小目标跟踪的研究与发展，还提供了一个强大的基准方法，即多级知识蒸馏网络(MKDNet)，该网络通过统一框架内的三级知识蒸馏有效增强了特征表示、区分和定位能力。数据集广泛应用于评估和验证MKDNet的优越性和有效性，为解决实际应用中的微小目标跟踪问题提供了重要平台。

LaTOT is a large-scale video dataset focused on tiny object tracking, developed by Anhui University. This dataset contains 434 video sequences, totaling over 217,000 frames, with each frame annotated with high-quality bounding boxes. It incorporates 12 challenging attributes to cover a wide range of viewpoints and scene complexities, aiming to promote attribute-based performance analysis. Not only does LaTOT advance the research and development of tiny object tracking, but it also provides a robust baseline method, namely Multi-Level Knowledge Distillation Network (MKDNet). This network effectively enhances feature representation, discrimination and localization capabilities through three-level knowledge distillation within a unified framework. The dataset is widely used to evaluate and verify the superiority and effectiveness of MKDNet, providing an important platform for solving tiny object tracking problems in real-world applications.

提供机构：

安徽大学

创建时间：

2022-02-11

搜集汇总

数据集介绍

构建方式

在视觉跟踪领域，微小目标因其外观特征微弱而构成显著挑战。LaTOT数据集的构建始于对微小目标的精确定义，综合考虑绝对尺寸与相对尺寸的双重阈值。研究团队从公开视频平台及自主采集设备中收集了434个视频序列，涵盖48个目标类别与270个场景。为确保标注质量，团队采用多阶段精细标注流程：首先对每帧图像进行放大处理以提升标注精度，标注准确度可达小数点后两位；随后由16名标注员与评估员进行三轮交叉检查与修正，最终形成包含超过21.7万帧的高质量密集边界框标注。

特点

LaTOT数据集展现出三大核心特征。其规模显著超越现有跟踪数据集，包含的微小目标视频序列数量达434个，总帧数超过21.7万，为深度跟踪器的训练与评估提供了充足数据。数据集具有高度多样性与挑战性，覆盖12类典型挑战属性，如快速运动、运动模糊、背景杂乱等，这些属性在自然场景中常同时出现，极大增加了跟踪难度。标注质量尤为突出，通过放大标注与多轮校验机制，实现了对微小目标的超精密边界框标注，为算法性能提供了可靠评估基准。

使用方法

LaTOT数据集为微小目标跟踪研究提供了系统化的评估平台。数据集已划分为训练集与测试集，其中269个序列用于训练，165个序列用于测试，支持端到端的深度学习模型训练。评估时可采用三种标准指标：基于5像素阈值的精确率、归一化精确率以及成功率曲线下面积。研究者可利用该数据集进行算法对比、挑战属性分析及模型微调。数据集中丰富的挑战属性标注支持细粒度性能诊断，有助于识别算法在特定场景下的薄弱环节，推动跟踪技术的针对性改进。

背景与挑战

背景概述

在计算机视觉领域，视觉跟踪作为一项核心任务，旨在连续定位视频序列中的目标对象。尽管近年来跟踪算法取得了显著进展，但在无人机、遥感监控及球类比赛等实际应用场景中，目标对象往往呈现尺寸微小、外观特征模糊的特性，导致现有通用跟踪器性能急剧下降。为系统性地推动微小目标跟踪研究，安徽大学研究团队于2021年创建了大规模微小目标跟踪数据集LaTOT。该数据集包含434段视频序列，总帧数超过21.7万，涵盖48类目标对象与270个场景，并创新性地定义了12种挑战属性。通过采用超精密标注技术，标注精度达到小数点后两位，为微小目标跟踪领域提供了首个具备大规模、高多样性、高质量标注的基准测试平台，显著促进了该领域算法研发与性能评估体系的完善。

当前挑战

LaTOT数据集致力于解决微小目标跟踪这一特定领域的核心挑战。微小目标因分辨率低下、外观信息匮乏、易受背景干扰等固有特性，导致传统跟踪算法在特征提取、目标判别与精确定位等方面面临严峻考验。具体表现为目标响应在特征图中信号微弱，难以与复杂背景有效区分，且易受运动模糊、光照突变等多重干扰因素影响。在数据集构建过程中，研究团队面临微小目标区域标注困难的技术瓶颈。为解决此问题，团队采用多阶段人工复核机制，通过放大帧图像进行亚像素级标注，并引入16名标注员与评估员进行三轮交叉校验，最终将标注误差控制在毫米级精度，确保了数据标注的可靠性与一致性。

常用场景

经典使用场景

在计算机视觉领域，微小目标跟踪因目标外观特征微弱、分辨率低下而极具挑战性。LaTOT数据集作为首个大规模微小目标跟踪基准，其经典使用场景集中于评估和提升跟踪算法在复杂现实环境中的鲁棒性。该数据集通过精心标注的434个视频序列，覆盖无人机航拍、遥感监测、体育赛事等多种实际场景，为研究者提供了丰富的微小目标样本，用于训练和测试跟踪模型在低分辨率、运动模糊及背景干扰等恶劣条件下的性能表现。

衍生相关工作

围绕LaTOT数据集，已衍生出一系列经典研究工作，其中最具代表性的是其伴随提出的多级知识蒸馏网络（MKDNet）。该网络通过特征级、得分级和IoU级的三层蒸馏机制，显著增强了微小目标的特征表示与定位能力，为后续研究设立了强基线。此外，基于LaTOT的评估框架激励了众多跟踪算法的改进，例如结合轨迹预测或光流方法以应对快速运动与运动模糊等挑战。数据集的开放也促进了跨领域方法的迁移探索，如将小目标检测中的特征增强策略融入跟踪流程，进一步拓展了微小目标感知的研究边界。

数据集最近研究