G2A-VReID

arXiv2024-08-14 更新2024-08-16 收录

下载链接：

https://github.com/FHR-L/VSLA-CLIP

下载链接

链接失效反馈

官方服务：

资源简介：

G2A-VReID数据集由西北工业大学和西安电子科技大学联合创建，是一个针对地面到空中视频人物再识别的大规模基准数据集。该数据集包含185,907张图像，分布在5,576个轨迹中，涵盖2,788个不同身份。数据集的创建过程中，使用了地面监控摄像头和无人机搭载摄像头在多种户外场景中捕捉视频，并通过模拟地面到空中的平台再识别任务来丰富数据集的视角和分辨率变化。G2A-VReID数据集主要应用于跨平台视频人物再识别领域，旨在解决由于视角、姿态和分辨率变化带来的挑战。

G2A-VReID dataset was jointly developed by Northwestern Polytechnical University and Xidian University, serving as a large-scale benchmark dataset for ground-to-aerial video person re-identification. This dataset contains 185,907 images distributed across 5,576 trajectories, covering 2,788 distinct identities. During the dataset construction, ground surveillance cameras and unmanned aerial vehicle (UAV)-mounted cameras were utilized to capture videos in diverse outdoor scenarios, and ground-to-aerial cross-platform person re-identification tasks were simulated to enrich the variations in viewpoint and resolution within the dataset. The G2A-VReID dataset is mainly applied in the field of cross-platform video person re-identification, aiming to tackle the challenges brought by variations in viewpoint, posture and resolution.

提供机构：

西北工业大学，西安陕西710000，中国西安电子科技大学，西安陕西710000，中国

创建时间：

2024-08-14

搜集汇总

数据集介绍

构建方式

G2A-VReID数据集通过模拟地面到空中的跨平台场景构建，包含185,907张图像和5,576个轨迹，涵盖2,788个不同的身份。数据集的采集过程通过固定地面监控摄像头并使用DJI消费级无人机在不同高度（20米至60米）飞行，模拟了地面与空中平台的跨平台视频采集。无人机的飞行模式随机调整，包括悬停、巡航和旋转，以丰富视角变化。此外，数据集涵盖了九种不同的户外场景，如学校、地铁站入口、旅游景点等，确保了场景的多样性和真实性。

特点

G2A-VReID数据集具有显著的视角变化、大量的标注身份、丰富的户外场景以及显著的分辨率差异。与现有视频ReID数据集相比，G2A-VReID的视角变化更为剧烈，身份数量更多，场景多样性更强，且由于无人机与地面摄像头的分辨率差异，图像质量存在显著差异。这些特点使得该数据集在跨平台视频ReID任务中具有更高的挑战性。

使用方法

G2A-VReID数据集可用于跨平台视频ReID任务的研究，特别适用于解决地面与空中平台之间的视觉对齐问题。研究者可以通过该数据集训练和评估模型，探索如何有效处理视角、姿态和分辨率的剧烈变化。数据集的多样性和大规模特性为开发新的视觉-语义对齐方法提供了理想的实验平台，尤其是在结合预训练的视觉-语言模型（如CLIP）进行跨平台特征对齐时，具有重要的应用价值。

背景与挑战

背景概述

G2A-VReID数据集是由西北工业大学和西安电子科技大学的研究人员于2024年构建的大规模基准数据集，专门用于地面到空中视频行人重识别（ReID）任务。该数据集包含了185,907张图像和5,576个轨迹，涵盖了2,788个不同的身份。作为首个针对地面到空中场景的视频ReID数据集，G2A-VReID具有显著的视角变化、丰富的户外场景以及巨大的分辨率差异等特点。该数据集的构建旨在解决跨平台视频行人重识别问题，特别是在城市监控摄像头与无人机平台之间的协同应用中，提供了一个具有挑战性的基准。

当前挑战

G2A-VReID数据集面临的主要挑战包括：1）视角变化剧烈，地面与空中摄像头的视角差异显著，导致行人外观和姿态的巨大变化；2）分辨率差异大，无人机拍摄的图像分辨率远低于地面摄像头，增加了特征对齐的难度；3）跨平台视觉特征对齐问题，由于设备差异，视觉特征在不同平台间的对齐变得异常复杂。此外，数据集的构建过程中还面临隐私保护、数据标注复杂性以及模拟真实场景的困难。这些挑战使得G2A-VReID成为视频ReID领域的一个重要研究方向。

常用场景

经典使用场景

G2A-VReID数据集的经典应用场景主要集中在跨平台视频行人重识别（ReID）任务中。该数据集通过模拟地面监控摄像头与无人机平台之间的视角差异，提供了丰富的户外场景和多样的视角变化，使得研究人员能够在复杂的跨平台环境下进行行人重识别算法的研究与优化。通过该数据集，研究人员可以探索如何在视角、分辨率和姿态剧烈变化的情况下，实现高效的行人特征对齐与匹配。

实际应用

G2A-VReID数据集在实际应用中具有广泛的潜力，特别是在城市安全监控和犯罪追踪领域。通过该数据集，研究人员可以开发出能够在地面监控摄像头与无人机平台之间无缝切换的行人重识别系统，从而在城市监控、交通管理、应急响应等场景中实现高效的行人追踪与识别。此外，该数据集还可以应用于自动驾驶、无人机巡逻等新兴领域，提升多平台环境下的目标识别与追踪能力。

衍生相关工作

G2A-VReID数据集的提出催生了一系列相关研究工作，特别是在跨平台视频行人重识别领域。基于该数据集，研究人员提出了多种视觉-语义对齐方法，如通过CLIP模型实现跨平台特征对齐的VSLA-CLIP方法。此外，该数据集还推动了视频集级别适配器（VSLA）和平台桥接提示（PBP）等技术的研究，这些技术在视频行人重识别任务中表现出色，并为后续的跨平台视觉对齐研究提供了新的思路和基准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集