OD-VIRAT
收藏arXiv2025-07-19 更新2025-07-18 收录
下载链接:
https://github.com/iscaas/OD-VIRAT
下载链接
链接失效反馈官方服务:
资源简介:
OD-VIRAT数据集是由佛罗里达大西洋大学智能系统、计算机架构、分析和安全实验室创建的,旨在为计算机视觉模型提供真实监控环境下的对象检测训练和评估。该数据集包含两个版本:OD-VIRAT Large和OD-VIRAT Tiny。OD-VIRAT Large包含599,996张图像,共8.7百万个标注实例;OD-VIRAT Tiny包含19,860张图像,共288,901个标注实例。这两个版本的数据集均涵盖了从高处和远距离记录的10种不同的人类监控场景。数据集的创建过程包括从VIRAT Ground 2.0数据集中选择相关视频,并将视频帧转换为图像。这些数据集适用于在具有复杂背景、遮挡的小物体和不同规模物体的监控图像上进行对象检测任务。
The OD-VIRAT dataset was developed by the Intelligent Systems, Computer Architecture, Analytics, and Security Lab at Florida Atlantic University, aiming to provide training and evaluation resources for computer vision models in real-world surveillance scenarios for object detection. This dataset includes two variants: OD-VIRAT Large and OD-VIRAT Tiny. OD-VIRAT Large contains 599,996 images with a total of 8.7 million annotated instances, while OD-VIRAT Tiny consists of 19,860 images and 288,901 annotated instances in total. Both variants cover 10 distinct human surveillance scenarios captured from elevated and long-distance viewpoints. The dataset construction workflow involves selecting relevant videos from the VIRAT Ground 2.0 dataset and converting video frames into static images. These datasets are tailored for object detection tasks on surveillance imagery with complex backgrounds, occluded small objects, and objects of varying scales.
提供机构:
佛罗里达大西洋大学智能系统、计算机架构、分析和安全实验室(ISCAAS Lab)
创建时间:
2025-07-17
搜集汇总
数据集介绍

构建方式
OD-VIRAT数据集是基于VIRAT Ground 2.0数据集构建的,专注于真实监控环境中的目标检测任务。数据集构建过程包括从VIRAT Ground 2.0中筛选260个视频,并分为训练集、验证集和测试集。通过两种帧采样策略(0帧跳过和30帧跳过)生成了两个版本:OD-VIRAT Large和OD-VIRAT Tiny。数据标注过程包括从原始数据集中提取边界框坐标,并将其转换为COCO格式的JSON文件。
特点
OD-VIRAT数据集包含10个不同的监控场景,涵盖了复杂背景、遮挡目标和小尺度目标等挑战性条件。OD-VIRAT Large包含599,996张图像和870万标注实例,而OD-VIRAT Tiny包含19,860张图像和288,901标注实例。数据集提供了丰富的边界框和类别标注,适用于目标检测模型的训练和评估。
使用方法
OD-VIRAT数据集可用于目标检测模型的训练和评估,支持多种先进架构如RTMDET、YOLOX、RetinaNet、DETR和Deformable-DETR。数据集提供了详细的实验设置和评估指标(如mAP、mAP50、mAP75等),可用于模型性能的全面分析。此外,数据集还支持对模型在噪声和扰动条件下的鲁棒性测试,为真实监控场景中的目标检测研究提供了重要基准。
背景与挑战
背景概述
OD-VIRAT数据集是由佛罗里达大西洋大学ISCAAS实验室的Hayat Ullah、Abbas Khan和Arslan Munir等人于2024年提出的,旨在解决现实监控场景中复杂环境下目标检测的挑战。该数据集包含OD-VIRAT Large和OD-VIRAT Tiny两个版本,分别包含599,996张图像(870万标注实例)和19,860张图像(28.9万标注实例),覆盖10种不同监控场景。OD-VIRAT的提出填补了现有监控数据集中缺乏复杂环境因素的空白,为开发更鲁棒的目标检测算法提供了重要基准。数据集通过从VIRAT Ground 2.0数据集扩展而来,特别关注小尺度目标、遮挡和复杂背景等现实挑战,已成为评估Transformer架构在监控场景性能的首选基准。
当前挑战
OD-VIRAT数据集主要面临三方面挑战:领域问题方面,需解决监控场景中因拍摄高度和距离导致的微小目标检测、复杂背景干扰以及频繁遮挡等难题;构建过程方面,需要从原始视频帧中精确提取并验证数百万级边界框标注,处理视频与标注间的时序对应关系;算法评估方面,现有模型在运动模糊、高斯噪声等扰动下性能平均下降19-29%,其中DETR架构在运动模糊干扰下mAP下降达80%,突显现实环境算法鲁棒性不足的问题。此外,数据集中小目标占比达45%,导致常规检测模型mAP下降30-40%,这对模型的多尺度检测能力提出严峻考验。
常用场景
经典使用场景
OD-VIRAT数据集在计算机视觉领域被广泛应用于复杂监控环境下的目标检测任务。该数据集通过提供大量从高处和远距离拍摄的监控视频序列,为研究者提供了丰富的真实场景数据。这些数据涵盖了10种不同的监控场景,包括建筑工地、停车场、街道等,为算法在复杂背景、遮挡和小尺度目标等挑战性条件下的性能评估提供了理想平台。
实际应用
在实际应用中,OD-VIRAT数据集支持了智能监控系统的开发与优化。基于该数据集训练的模型可应用于公共场所安全管理、交通监控、异常行为检测等多个领域。数据集中的远距离拍摄视角和复杂场景特别适合城市安防系统的需求,帮助提高监控系统在真实环境中的检测准确性和可靠性。
衍生相关工作
OD-VIRAT数据集催生了一系列关于监控场景目标检测的研究工作。基于该数据集,研究者对RTMDET、YOLOX、RetinaNet、DETR和Deformable-DETR等先进架构进行了系统评估。这些工作不仅建立了性能基准,还推动了针对监控场景的特化模型改进,如小目标检测增强和遮挡处理技术的创新。
以上内容由遇见数据集搜集并总结生成



