five

MUVAD

收藏
arXiv2026-01-16 更新2026-01-20 收录
下载链接:
https://github.com/uavano/FTDMamba
下载链接
链接失效反馈
官方服务:
资源简介:
MUVAD是由安徽大学与香港中文大学(深圳)联合构建的大规模动态背景无人机视频异常检测数据集,包含46个训练视频和72个测试视频,共计222,736帧图像,标注了12类异常事件共240个实例。该数据集首次聚焦移动无人机拍摄的动态背景场景,通过真实飞行采集数据,弥补了现有静态背景数据集的局限性。其构建过程涉及复杂场景下的多源运动耦合标注,旨在解决动态背景下异常事件识别精度低的核心挑战,为智能安防、交通监管等领域的算法研究提供重要基准。

MUVAD is a large-scale dynamic background UAV video anomaly detection dataset jointly constructed by Anhui University and The Chinese University of Hong Kong, Shenzhen. It contains 46 training videos and 72 test videos, totaling 222,736 image frames, with 240 instances of 12 types of anomalous events annotated. This dataset is the first to focus on dynamic background scenes captured by moving UAVs, collecting data through actual flight operations to address the limitations of existing static background datasets. Its construction involves multi-source motion coupling annotation in complex scenarios, aiming to solve the core challenge of low accuracy in anomalous event recognition under dynamic backgrounds, and providing an important benchmark for algorithm research in fields such as intelligent security and traffic supervision.
提供机构:
安徽大学·信息材料与智能感知安徽省实验室; 安徽大学·多模态认知计算安徽省重点实验室; 安徽大学·计算机科学与技术学院; 香港中文大学(深圳)·计算机科学与工程系
创建时间:
2026-01-16
原始信息汇总

FTDMamba数据集概述

数据集基本信息

  • 数据集名称:FTDMamba
  • 官方存储库地址:https://github.com/uavano/FTDMamba
  • 状态:代码与新数据集将公开可用

数据集主要用途

  • 核心任务:无人机视频异常检测
  • 主要应用场景:动态背景下的无人机视频
  • 扩展应用场景:静态背景下的无人机视频

相关研究背景

  • 对应方法:FTDMamba(Frequency-Assisted Temporal Dilation Mamba)
  • 研究重点:用于无人机视频异常检测的频域辅助时间膨胀Mamba方法
搜集汇总
数据集介绍
main_image_url
构建方式
在无人机视频异常检测领域,现有数据集多聚焦于静态背景场景,难以满足实际动态飞行环境下的研究需求。为此,MUVAD数据集通过整合真实无人机航拍视频与公开平台资源,系统性地采集了涵盖城市道路、交通枢纽等高动态场景的视觉数据。数据构建过程严格遵循无监督学习范式,训练集仅包含正常样本,而测试集则标注了12类共计240起异常事件,每帧均经过多标注者交叉验证与专家复核,确保了标签的准确性与一致性。最终,数据集包含222,736帧视频,所有序列均以30帧/秒的速率采集,空间分辨率统一为852×480像素,为动态背景下的异常检测研究提供了高质量基准。
特点
MUVAD数据集的核心特点在于其全面模拟了无人机在实际运动状态下捕获的动态背景场景,这与以往静态悬停无人机数据集形成鲜明对比。数据集囊括了昼夜交替、多样天气条件及复杂无人机运动模式(如平移、旋转、跟踪)下的视频序列,极大增强了场景的多样性与真实性。异常类型设计紧扣交通监控领域,涵盖了非法变道、车辆碰撞、行人闯入等12类具有明确语义定义的典型事件,且异常事件均嵌入在全局运动与局部运动耦合的动态背景中,显著提升了检测任务的挑战性。此外,数据规模庞大、标注精细,为模型在复杂动态环境下的泛化能力评估提供了可靠依据。
使用方法
MUVAD数据集的使用遵循视频异常检测领域标准的无监督学习协议。研究人员可利用训练集中的正常视频序列训练模型学习正常模式分布,无需接触任何异常样本。在测试阶段,模型对测试视频序列进行帧级预测或重构,通过计算预测帧与真实帧之间的误差(如峰值信噪比)来生成异常分数,进而根据自适应阈值区分正常与异常帧。该数据集支持以曲线下面积、等错误率等指标进行性能评估,尤其适用于验证模型在动态背景中解耦多源运动、抵抗背景干扰的能力。数据集的发布旨在推动无人机视频异常检测算法从静态背景到动态真实场景的跨越,为领域发展提供关键实验平台。
背景与挑战
背景概述
MUVAD数据集由安徽大学智能感知与计算实验室联合香港中文大学(深圳)于2025年构建,旨在解决动态背景下无人机视频异常检测的核心研究问题。随着无人机技术在安防、交通管理等领域的广泛应用,传统基于静态背景的异常检测方法难以应对无人机持续运动引发的多源运动耦合挑战。该数据集包含222,736帧视频,涵盖12类共240个异常事件,首次系统性地提供了大规模动态背景无人机视频数据,为推进无人机视频异常检测技术的实际部署奠定了关键基础。
当前挑战
MUVAD数据集致力于解决动态背景下无人机视频异常检测的领域挑战,其核心在于如何有效分离无人机自身运动与前景目标运动耦合的多源运动模式,避免将正常无人机运动误判为异常。在构建过程中,面临两大主要挑战:一是数据采集需模拟真实场景中无人机的连续运动模式,同时确保异常事件的多样性与标注准确性;二是现有方法普遍缺乏对动态背景的针对性建模,难以在复杂运动耦合中精确捕捉真实异常,这要求数据集必须提供高质量、大规模且背景动态变化的视频序列以支撑算法创新。
常用场景
经典使用场景
在无人机视频异常检测领域,MUVAD数据集为动态背景下的异常行为识别提供了关键基准。该数据集通过模拟无人机持续运动时捕获的真实场景,涵盖了城市道路、交通枢纽等高动态环境,其中异常事件如非法变道、车辆碰撞等与复杂的背景运动相互耦合。研究者在训练阶段仅使用正常样本,通过未来帧预测或重构等无监督范式,学习正常运动模式,进而在测试阶段识别偏离该模式的异常帧。MUVAD的引入使得算法能够评估在动态背景干扰下区分真实异常与正常无人机运动的能力,推动了该领域从静态背景向动态场景的范式转移。
衍生相关工作
MUVAD数据集的发布催生了一系列针对动态无人机视频异常检测的创新工作。以FTDMamba为代表的框架结合了频率辅助解耦与时空Mamba模块,在MUVAD上实现了先进性能,启发了后续研究对多尺度时序建模与运动分离的深入探索。该数据集亦促进了如频率域特征分解、选择性状态空间模型在视频分析中的迁移应用。相关衍生工作进一步拓展至多模态融合、生成式异常建模等方向,利用MUVAD的复杂动态特性验证算法在真实场景下的有效性。这些进展共同推动了无人机异常检测领域从方法创新到实际部署的完整研究链条。
数据集最近研究
最新研究方向
随着无人机技术的普及,动态背景下的视频异常检测成为计算机视觉领域的前沿挑战。MUVAD数据集的构建填补了现有静态背景数据集的空白,推动了针对多源运动耦合问题的研究。当前研究热点聚焦于频率域分析与状态空间模型的结合,例如FTDMamba框架通过频率解耦时空相关模块分离全局与局部运动,并利用时序扩张Mamba模块建模多尺度时空特征。这一方向不仅提升了动态场景下异常检测的鲁棒性,也为无人机在智慧城市、交通管理等实际应用中的实时监控提供了关键技术支撑。
相关研究论文
  • 1
    FTDMamba: Frequency-Assisted Temporal Dilation Mamba for Unmanned Aerial Vehicle Video Anomaly Detection安徽大学·信息材料与智能感知安徽省实验室; 安徽大学·多模态认知计算安徽省重点实验室; 安徽大学·计算机科学与技术学院; 香港中文大学(深圳)·计算机科学与工程系 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作