five

Bearing-UAV-90K

收藏
arXiv2026-03-24 更新2026-03-25 收录
下载链接:
https://github.com/liukejia121/bearinguav
下载链接
链接失效反馈
官方服务:
资源简介:
Bearing-UAV-90K是由浙江大学团队构建的多城市跨视角无人机导航基准数据集,包含9万组无人机视角与卫星视角的配对图像。该数据集通过采集城市环境中的低空倾斜影像与高空正射卫星图,重点解决视角差异、特征错位和稀疏性等挑战。数据经过严格的空间对齐和天气多样性增强处理,支持无人机在GNSS拒止环境下的视觉定位与航向联合估计,为跨视角地理定位算法提供真实场景验证平台。

Bearing-UAV-90K is a multi-city cross-view drone navigation benchmark dataset constructed by the team from Zhejiang University, which contains 90,000 paired image sets of drone-view and satellite-view imagery. This dataset collects low-altitude oblique aerial images and high-altitude orthorectified satellite maps in urban environments, focusing on addressing core challenges such as viewpoint discrepancy, feature misalignment and data sparsity. The data has undergone rigorous spatial alignment and weather diversity augmentation processing, supporting joint visual positioning and heading estimation for drones in GNSS-denied environments, and providing a real-world validation platform for cross-view geo-localization algorithms.
提供机构:
浙江大学·计算机科学与技术学院; 浙江大学·区块链与数据安全国家重点实验室; 杭州高新区(滨江)区块链与数据安全研究院
创建时间:
2026-03-24
原始信息汇总

Bearing-UAV 数据集概述

数据集简介

Bearing-UAV 是一个纯粹由视觉驱动的跨视图导航方法,能够从邻近特征和当前无人机视角联合预测无人机的绝对位置和航向,实现在野外环境中的精准、轻量且鲁棒的导航。同时,该项目提出了 Bearing-UAV-90K 基准数据集,用于评估无人机-卫星跨视图定位与导航。

核心组件

  • Bearing-UAV: 视觉驱动的跨视图导航方法。
  • Bearing-Naver: 视觉驱动的点对点导航方案,沿城市场景中的指定航点行进。
  • Bearing-UAV-90K: 用于评估无人机-卫星跨视图定位与导航的多城市基准数据集。

数据集详情 (Bearing-UAV-90K)

数据集包含四个具有不同景观的城市(A、B、C、D),结构如下:

  • city_rsi/: 4个城市的遥感图像。
  • citya/: 城市A的数据集。
    • uav_254k_37bc_b15_s100(45000): 包含22500个无人机视角图像块及其JSON文件。
    • sat_254k_37bc_b15_s100(23400): 包含22500个卫星视角图像块和900个遥感图块。
    • rawmetadata.csv: 原始样本元数据。
  • cityb/: 城市B的数据集。
  • cityc/: 城市C的数据集。
  • cityd/: 城市D的数据集。
  • c4m_254k_96bc_b15_s100_v3d/: 无人机-卫星跨视图数据集索引文件。
    • metadata/metadata.csv
  • c4m_254k_96bc_b15_s100/: 卫星-卫星参考数据集索引文件。
  • c1_254k_96bc_b15_s1_v3d/: 小型多城市调试数据集。
  • c1_254k_96bc_b15_s1/: 小型多城市调试数据集。
  • c1_254k_37bc_b15_s1_v3d/: 小型单城市调试数据集。

预训练模型

项目提供了最佳模型权重,位于 <Bearing_UAV>/ 目录下:

  • cross_view/: 无人机-卫星跨视图 Bearing-UAV 模型。
    • best_model.pth: 模型权重。
    • training_configure.json: 模型配置。
  • satellite_view/: 卫星-卫星参考 Bearing-UAV 模型。
    • best_model.pth: 模型权重。
    • training_configure.json: 模型配置。

数据与代码获取

  • 源代码、数据集和模型权重可从 GitHub 和 Hugging Face 下载。
  • Hugging Face 地址:https://huggingface.co/datasets/HaoyZhou/bearinguav/tree/main
  • GitHub 仓库地址:https://github.com/liukejia121/bearinguav

引用

如需在研究中引用此工作,请使用以下BibTeX格式: text @article{xxx2026bearinguav, title={Beyond Matching to Tiles: Bridging Unaligned Aerial and Satellite Views for Vision-Only UAV Navigation}, author={Kejia Liu, Haoyang Zhou, Ruoyu Xu, Peicheng Wang, Mingli Song, Haofei Zhang}, journal={CVPR}, year={2026} }

搜集汇总
数据集介绍
main_image_url
构建方式
在无人机视觉导航领域,Bearing-UAV-90K数据集的构建旨在解决跨视图地理定位中的未对齐与特征稀疏挑战。该数据集通过谷歌地球平台,在二维卫星视图模式下采集了四个城市的连续遥感图像,并将其划分为16×16的遥感图块,进而组合成15×15个遥感区块。每个区块内,利用三维无人机视图模式随机采样100个相机位置与偏航角,生成了总计九万对跨视图图像样本。每个样本包含无人机视角补丁、对应的卫星视角补丁以及相对坐标与航向角信息,确保了地理标记的精确性与场景多样性。
特点
Bearing-UAV-90K数据集在跨视图地理定位基准中展现出显著特点。其覆盖多城市环境,包含建筑、河流、山地等多样化地形,提供了丰富的视觉变化。数据集特别强调了无人机与卫星视图之间的未对齐情况,通过任意旋转与重叠度变化模拟真实场景中的视差问题。此外,数据集首次引入了航向感知标注,支持联合位置与航向估计任务,为纯视觉无人机导航提供了全面评估平台。其大规模样本量与精细的地理标注,使得模型能够在特征稀疏与视角差异条件下进行鲁棒性训练与验证。
使用方法
该数据集主要用于训练与评估跨视图地理定位及导航模型。研究人员可利用其提供的无人机视角补丁、卫星遥感图块及坐标信息,构建端到端的回归网络,实现超出图块匹配精度的位置与航向联合预测。在导航任务中,数据集支持设计多航点曲线路径,通过连续的城市地图与三维视图模拟真实飞行环境。用户可基于预定义的评估协议,计算召回率、定位成功率等指标,分析模型在未对齐场景下的泛化能力与鲁棒性,进而推动纯视觉无人机导航技术的发展。
背景与挑战
背景概述
Bearing-UAV-90K数据集由浙江大学研究团队于2026年构建,旨在推动无人机在GNSS拒止环境下的纯视觉导航研究。该数据集聚焦于解决跨视角地理定位中的核心难题,即无人机视角与卫星视角图像之间的未对齐匹配问题。通过整合四个城市的连续卫星图块与大量未对齐的无人机视角图像,该数据集不仅支持位置回归,还首次提供了航向角标注,为无人机端到端导航提供了关键数据支撑。其多城市、多场景的设计显著提升了模型在真实复杂环境中的泛化能力,对低空经济与自主导航领域具有重要影响力。
当前挑战
Bearing-UAV-90K数据集主要应对两大挑战:在领域问题层面,传统跨视角地理定位方法受限于图像匹配范式,难以在未对齐、视角差异大且特征稀疏的条件下实现高精度定位与航向估计;现有方法多忽略航向信息,无法支持无人机连续导航。在构建过程中,数据采集需克服无人机视角与卫星视角之间的显著视差、光照变化以及季节差异,同时确保多城市地理数据的连续性与标注一致性。此外,数据集的规模与多样性要求对采样策略与存储管理提出了较高要求,需在有限资源下实现大规模、高质量的多视角图像对采集与对齐。
常用场景
经典使用场景
在无人机视觉导航领域,Bearing-UAV-90K数据集为跨视角地理定位研究提供了关键基准。该数据集通过整合多城市、连续分布的卫星图块与未对齐的无人机视角图像,构建了包含九万对样本的大规模评估平台。其经典应用场景在于支持基于纯视觉的无人机定位与航向联合估计,突破了传统匹配到图块范式在精度与存储效率之间的固有权衡,为GNSS拒止环境下的自主导航提供了可靠的视觉参考框架。
实际应用
在实际应用中,Bearing-UAV-90K为无人机在紧急响应、工业巡检与低空经济等关键领域提供了可靠的导航解决方案。基于该数据集训练的模型能够仅依靠视觉输入,在无全球导航卫星系统支持的条件下实现高精度定位与航向估计,显著提升了无人机在复杂城市环境中的自主性与安全性。其轻量化设计支持实时推理,使得无人机能够在长距离飞行中持续进行状态更新,为完全视觉驱动的点对点导航奠定了实践基础。
衍生相关工作
该数据集的推出催生了一系列围绕跨视角联合估计的经典研究工作。例如,基于Bearing-UAV框架的导航系统Bearing-Naver实现了纯视觉驱动的航点跟踪,为长距离自主飞行提供了新范式。同时,数据集的天气增强版本促进了视觉表征对光照、雾、雨、雪等干扰因素的鲁棒性研究。这些衍生工作不仅深化了对视角差异与未对齐问题的理解,也为多传感器融合与动态场景适应等前沿方向提供了重要的基准与启发。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作