UAVDT
收藏arXiv2025-09-30 收录
下载链接:
https://sites.google.com/view/grli-uavdt/%e9%a6%96%e9%a1%b5
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个基于无人机拍摄的车辆检测与追踪数据集,包含了在各种复杂场景下捕获的图像。具体来说,共有40,409张UAVDT图像,它们被划分为训练集的23,829张图像和测试集的16,580张图像。该数据集的规模达到80,000张图像,涵盖了超过2,700辆标注的车辆,旨在支持车辆检测与追踪的任务。
This dataset is a UAV-captured vehicle detection and tracking dataset, which comprises images acquired in diverse complex scenarios. Specifically, it contains a total of 40,409 UAVDT images, which are split into 23,829 training images and 16,580 test images. The dataset has a total scale of 80,000 images, covers over 2,700 annotated vehicles, and is designed to support vehicle detection and tracking tasks.
搜集汇总
数据集介绍

构建方式
在无人机视觉任务领域,UAVDT数据集的构建体现了对复杂现实场景的深入模拟。该数据集从超过10小时的原始视频中精心筛选出约80,000帧代表性图像,覆盖了广场、主干道、收费站、高速公路、十字路口和丁字路口等多种城市场景。所有帧均以1080×540像素分辨率录制,帧率为30fps。通过VATIC标注工具,十余位领域专家耗时两个月进行了密集的人工标注,共标注了超过2,700辆车辆,生成约84万个边界框。标注过程中遵循PASCAL VOC标准,忽略了分辨率过低的区域,并通过多轮复核最大限度减少误差。数据集按任务划分为训练集(30个序列)和测试集(70个序列),且训练与测试场景在保持相似性的同时避免了位置重叠,有效降低了模型过拟合的风险。
特点
UAVDT数据集的核心特点在于其全面覆盖了无人机视角下的多重挑战。该数据集不仅支持目标检测、单目标跟踪和多目标跟踪三大基础任务,还引入了14类精细化属性标注,包括天气条件、飞行高度、摄像机视角、车辆类别及遮挡程度等。这些属性深刻反映了无人机场景中特有的高密度目标、小目标尺寸以及剧烈摄像机运动等难题。与现有无人机数据集相比,UAVDT在目标密度(平均每帧10.52个目标)和场景多样性方面表现突出,其数据源自无约束的真实环境,而非特定受限场景。此外,数据集中27.5%的目标像素少于400,凸显了小目标检测与跟踪的严峻挑战,为算法鲁棒性评估提供了苛刻而真实的测试平台。
使用方法
UAVDT数据集为计算机视觉研究提供了系统化的评估框架。研究者可依据任务需求,分别使用其目标检测、单目标跟踪或多目标跟踪子集进行模型训练与测试。对于目标检测任务,可采用PASCAL VOC标准的平均精度指标进行评估,重叠度阈值设定为0.7;多目标跟踪任务则综合使用MOTA、MOTP、IDF1等多种度量指标;单目标跟踪任务遵循主流跟踪基准,通过成功率曲线和精确度曲线进行性能分析。数据集中丰富的属性标注支持细粒度性能剖析,例如在不同天气、高度或视角条件下分别验证算法表现。该数据集已划分好训练与测试集,确保了评估的公正性,其高挑战性的数据特性尤其适合推动无人机视觉算法在实时性、场景先验利用、运动线索融合及小目标处理等方面的前沿探索。
背景与挑战
背景概述
无人机技术的迅猛发展催生了计算机视觉领域对高效智能视觉系统的迫切需求,传统固定视角监控系统在灵活性上存在局限,而无人机凭借其高机动性、广阔视野和统一尺度优势,为视觉任务带来新的机遇与挑战。在此背景下,中国科学院大学、哈尔滨工业大学等机构的研究团队于2018年共同构建了UAVDT数据集,旨在为无人机场景下的目标检测、单目标跟踪与多目标跟踪三大核心任务提供综合性基准。该数据集从超过10小时的原始视频中精选约8万帧图像,涵盖城市广场、高速公路、交叉路口等多种复杂场景,并标注了天气条件、飞行高度、相机视角等14类属性,显著推动了无人机视觉算法的研究与评估。
当前挑战
UAVDT数据集致力于解决无人机视角下目标检测与跟踪的领域挑战,主要包括高密度目标、小尺寸目标、剧烈相机运动及实时性要求等难题。这些挑战源于无人机拍摄视角的特性:高空俯瞰导致目标像素占比极低,广角视野引入密集目标分布,而高速飞行与相机旋转则引发目标与背景的快速相对运动。在构建过程中,研究团队面临数据标注的复杂性,需对大量视频帧进行精细边界框标注与多属性分类,同时确保场景多样性与真实性,避免过拟合特定环境。此外,数据集的划分需平衡训练与测试集的地理差异性与场景相似性,以提升算法泛化能力。
常用场景
经典使用场景
在无人机视觉感知领域,UAVDT数据集作为一项关键基准,广泛应用于评估目标检测与跟踪算法在复杂动态场景下的性能。该数据集通过模拟真实无人机拍摄环境,涵盖高密度目标、小尺寸物体及剧烈相机运动等挑战,为研究者提供了验证算法鲁棒性与泛化能力的标准化平台。其多任务标注体系支持检测、单目标跟踪与多目标跟踪的联合评估,推动了跨任务协同优化方法的发展。
实际应用
该数据集直接服务于城市安防监控、交通流量分析与灾害应急响应等实际场景。无人机搭载的视觉系统可利用UAVDT训练的模型,实现对高速道路车辆密度的实时统计、违规行为自动识别以及大规模活动人群的动态追踪。其标注的夜间、雾霾等极端条件数据,进一步增强了算法在恶劣环境下的部署稳定性,为智慧城市与自动化巡检系统提供了可靠的技术验证基础。
衍生相关工作
基于UAVDT数据集的评估催生了一系列创新研究,如针对小目标优化的特征金字塔网络改进、融合运动信息的时空关联跟踪框架,以及面向嵌入式平台的轻量级检测模型压缩技术。这些工作不仅提升了算法在无人机场景的精度与效率,更推动了多传感器融合、跨域自适应学习等前沿方向的发展,形成了从数据驱动到理论突破的良性研究生态。
以上内容由遇见数据集搜集并总结生成



