IR-VL328
收藏github2025-11-11 更新2025-11-22 收录
下载链接:
https://github.com/liutao23/ODGNNLoc
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于跨视角无人机定位实验,包含无人机和卫星图像数据,按照University1652-Baseline和SUES-200-Benchmark的格式组织。数据集目录结构包括训练集(train)中的无人机(drone)和卫星(satellite)图像文件夹,以及查询(query_drone/query_satellite)和图库(gallery_drone/gallery_satellite)文件夹。无人机图像为.jpg格式,卫星图像为.png格式。
This dataset is intended for cross-view drone localization experiments, containing drone and satellite image data, and is structured following the specifications of University1652-Baseline and SUES-200-Benchmark. The dataset’s directory structure includes folders for drone and satellite images in the training set (train), as well as query set folders (query_drone/query_satellite) and gallery set folders (gallery_drone/gallery_satellite). Drone images are stored in .jpg format, while satellite images are saved in .png format.
创建时间:
2025-11-04
原始信息汇总
ODGNNLoc 数据集概述
数据集基本信息
- 数据集名称:IR-VL328
- 研究领域:跨视角无人机定位
- 核心方法:基于目标检测和图神经网络的跨模态匹配
数据集用途
- 用于跨视角无人机定位研究
- 支持无人机与卫星图像之间的跨模态匹配
- 适用于跨时间、跨视角、跨模态的鲁棒匹配任务
数据集结构
目录组织
IR-VL328/ ├── train/ │ ├── drone/ │ │ ├── 0000/ 至 0200/ 子目录 │ │ └── 包含 .jpg 格式图像 │ └── satellite/ │ ├── 0000/ 至 0200/ 子目录 │ └── 包含 .png 格式图像 ├── query_drone/ ├── query_satellite/ ├── gallery_drone/ └── gallery_satellite/
文件格式
- 无人机图像:.jpg 格式
- 卫星图像:.png 格式
数据获取方式
数据集下载链接
- 百度网盘:https://pan.baidu.com/s/1yarjck2JBaXJ7s3nDZaITw?pwd=52bj
- Google Drive:https://drive.google.com/file/d/1okFeWJIuZ49TnkZkkoOYTOl_b0THwUdc/view?usp=sharing
预训练权重
- 百度网盘:https://pan.baidu.com/s/17QHtGe5YWN-g6inP94h7gA
- 提取码:52sb
数据集特点
- 遵循 University1652-Baseline 和 SUES-200-Benchmark 的目录规范
- 便于复用现有检索框架和评测脚本
- 支持无人机与卫星图像的跨视角匹配任务
引用信息
bibtex @misc{liu2025objectdetectionoptionalbasis, title={Object Detection as an Optional Basis: A Graph Matching Network for Cross-View UAV Localization}, author={Tao Liu and Kan Ren and Qian Chen}, year={2025}, eprint={2511.02489}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2511.02489}, }
搜集汇总
数据集介绍

构建方式
在跨视角无人机定位研究领域,IR-VL328数据集的构建采用了多模态图像融合策略。该数据集通过采集无人机航拍图像与卫星遥感图像构建双视角数据源,并严格遵循University1652与SUES-200等基准数据集的目录规范。构建过程中将图像按训练集、查询集和检索集进行划分,其中无人机图像采用JPEG格式存储,卫星图像则使用PNG格式,确保数据组织的规范性与后续研究的可复现性。
使用方法
针对跨模态定位任务,研究者可通过标准化数据接口快速加载数据集。使用时应按照既定目录结构分别读取无人机与卫星图像数据,利用预定义的查询-检索划分进行模型训练与评估。数据集兼容主流跨视角检索框架,开发者可直接复用现有代码库实现基线方法。为保障研究连续性,建议配合作者提供的预训练模型进行迁移学习,以获得更稳定的跨模态特征表示。
背景与挑战
背景概述
跨视角无人机定位作为计算机视觉领域的前沿研究方向,致力于解决无人机视角与卫星视角之间的空间匹配难题。IR-VL328数据集由南京理工大学研究团队于2025年创建,核心研究目标是通过目标检测与图神经网络技术,构建能够跨越时间、视角和模态差异的鲁棒定位系统。该数据集延续了University1652和SUES-200等基准数据集的架构设计,为无人机自主导航、智慧城市管理等应用提供了重要的实验基础。
当前挑战
跨视角定位任务面临多重技术挑战:在领域层面,无人机与卫星图像间存在显著的视角差异、分辨率不一致和光照条件变化,传统图像匹配方法难以建立稳定对应关系。数据构建过程中,需要精确标注多模态图像中的语义目标,并建立有效的空间关系图谱。同时,图神经网络的训练需要平衡节点特征提取与图结构建模的复杂度,这对计算资源和算法设计提出了更高要求。
常用场景
经典使用场景
在跨视角地理定位研究领域,IR-VL328数据集为无人机与卫星图像间的匹配任务提供了标准化基准。该数据集通过构建无人机视角与卫星视角的图像对,支持基于图神经网络的跨模态匹配算法开发。研究人员可利用其丰富的空间关系标注,探索目标检测与图匹配相结合的创新方法,推动跨视角定位技术的精进。
解决学术问题
该数据集有效解决了跨视角图像匹配中的三大核心挑战:视角差异导致的几何形变、时间变化引起的场景动态性以及模态差异带来的特征不对齐问题。通过提供精确的目标实例标注与空间关系定义,为图神经网络建模跨视角语义关联奠定了数据基础,显著提升了跨模态检索任务的准确性与鲁棒性。
实际应用
在现实应用层面,IR-VL328支撑的定位技术已延伸至城市管理、灾害救援与农业监测等多个领域。无人机通过实时采集地面图像,与卫星底图进行快速匹配,可实现精准的自主导航与位置服务。这种技术特别适用于GPS信号受限的复杂环境,为智慧城市建设和应急响应提供了可靠的空间感知解决方案。
数据集最近研究
最新研究方向
在跨视角无人机定位领域,IR-VL328数据集正推动着基于图神经网络与目标检测融合的前沿探索。研究者们通过提取无人机与卫星图像中的显著实例构建空间语义图,利用图匹配技术突破传统视觉定位中视角差异与模态鸿沟的局限。这一方向与智慧城市感知、应急响应等热点应用紧密结合,通过多源异构数据的协同推理,为复杂环境下的自主导航系统提供了新的理论框架与实践基准。
以上内容由遇见数据集搜集并总结生成



