Deep Visual Geo-localization Benchmark

github2024-05-07 更新2024-05-31 收录

下载链接：

https://github.com/hmf21/AerialDataset

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个视觉地理定位数据集的修订版本，增加了一些定制模块以满足特定数据集的需求。详细数据集将在论文被接受后提供。

This is a revised version of a visual geolocation dataset, incorporating several customized modules to meet the specific requirements of the dataset. The detailed dataset will be provided upon the acceptance of the paper.

创建时间：

2023-06-26

原始信息汇总

数据集概述

数据集名称

Deep Visual Geo-localization Benchmark

数据集版本

修订版

数据集来源

基于原始的Deep VGL benchmark，该版本添加了定制模块以适应特定数据集需求。

数据集可用性

数据集的详细信息和完整内容将在相关论文被接受后提供。

数据集使用方法

使用命令：python eval.py
参数配置：
- --datasets_folder: 指定数据集目录
- --dataset_name: 指定数据集名称
- --backbone: 指定模型骨干网络，如resnet101conv4
- --aggregation: 指定特征聚合方法，如gem
- --resume: 指定预训练模型路径，如./pretrained_models/msls_r101l3_gem_partial.pth
- --split_folder: 指定分割文件夹名称
- --add_rerank: 指定重排序方法，如local_match

搜集汇总

数据集介绍

构建方式

该数据集通过无人机搭载的RGB相机（FLIR BFS-U3-31S4C-C）和GNSS（NovAtel OEM718D）设备，采集了覆盖约70公里轨迹的飞行数据，涵盖多种地形、高度和光照变化。数据集分为两部分：序列化视觉定位和视觉地点识别。序列化视觉定位部分包含11个不同长度的帧序列，最长可达11公里；视觉地点识别部分则提供了18361张单独的航空图像及其对应的14096张地图补丁。此外，数据集还包括从不同年份收集的卫星图像，用于训练模型。

特点

该数据集的显著特点在于其多样性和全面性。飞行数据涵盖了多种地形和光照条件，确保了数据集的广泛适用性。序列化视觉定位部分提供了不同长度的飞行轨迹，适合于不同复杂度的实验需求。视觉地点识别部分则通过提供大量的航空图像和对应的地图补丁，支持高精度的地点识别任务。此外，数据集还包括了从不同年份收集的卫星图像，为模型训练提供了丰富的资源。

使用方法

用户可以通过清华大学云盘或百度网盘下载数据集，包括捕获的帧和用于训练的卫星图像。数据集分为序列化视觉定位和视觉地点识别两部分。对于序列化视觉定位，用户可以使用提供的不同长度的飞行轨迹进行实验。对于视觉地点识别，用户可以利用提供的航空图像和对应的地图补丁进行地点识别任务。此外，数据集还提供了从不同年份收集的卫星图像，用户可以利用这些图像进行模型训练和验证。

背景与挑战

背景概述

Deep Visual Geo-localization Benchmark（AerialVL）数据集由清华大学等机构的研究人员于2024年创建，旨在推动基于航空图像的视觉定位技术的发展。该数据集涵盖了约70公里的飞行轨迹，包含多种地形、高度变化及光照条件，提供了11个不同长度的帧序列以及18361张独立的航空图像和14096张对应的卫星地图切片。通过结合航空图像与卫星地图，AerialVL数据集为视觉定位和场景识别提供了丰富的训练和评估资源，推动了无人机导航、地理定位等领域的研究进展。

当前挑战

AerialVL数据集在构建过程中面临多重挑战。首先，数据采集涉及复杂的传感器设置，包括高精度GNSS设备和稳定的三轴云台，以确保图像的稳定性和地理信息的准确性。其次，数据集涵盖了多种地形和光照条件，增加了模型在不同环境下的泛化难度。此外，视觉定位任务中，如何有效匹配航空图像与卫星地图，尤其是在视角和分辨率差异较大的情况下，仍是一个技术难题。最后，数据集的规模和多样性要求高效的存储和处理方法，以支持大规模训练和评估。

常用场景

经典使用场景

在地理定位与视觉识别领域，Deep Visual Geo-localization Benchmark（AerialVL）数据集的经典应用场景主要集中在无人机视觉定位与地图匹配任务中。该数据集通过提供多路径、多高度和光照变化的飞行数据，支持序列化视觉定位（VAL）和视觉地点识别（VPR）任务。具体而言，研究者可以利用该数据集训练和评估无人机在复杂环境下的定位精度，尤其是在不同地形和光照条件下的鲁棒性。

解决学术问题

该数据集解决了无人机视觉定位中的关键学术问题，包括在复杂地形和光照变化下的定位精度提升、地图匹配算法的鲁棒性验证以及多源数据融合的有效性评估。通过提供高精度的地理参考地图和多样化的飞行数据，AerialVL为研究者提供了一个标准化的测试平台，推动了视觉定位技术在无人机领域的深入研究与应用。

衍生相关工作

基于AerialVL数据集，研究者们开发了多种视觉定位和地图匹配算法，推动了无人机视觉定位技术的快速发展。例如，一些研究工作提出了基于深度学习的视觉定位模型，显著提升了定位精度；另一些工作则探索了多源数据融合技术，增强了算法在复杂环境下的鲁棒性。这些衍生工作不仅丰富了视觉定位领域的研究内容，也为实际应用提供了强有力的技术支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集