layumi/university-1652
收藏Hugging Face2025-10-24 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/layumi/university-1652
下载链接
链接失效反馈官方服务:
资源简介:
University-1652是一个基于无人机的多视角地理定位数据集,标注了72所大学中的1652座建筑物(ACM Multimedia 2020,论文:https://arxiv.org/abs/2002.12186)。该数据集被50多篇论文引用,支持无人机到卫星的定位和卫星到无人机的导航。数据集分为训练集和测试集,包含无人机、卫星、街道和4K无人机图像,以及建筑标识符、视图类型和分割类型等信息。数据集大小约为9.2GB(解压后)。
University-1652 is a multi-view dataset for drone-based geo-localization, annotating 1652 buildings across 72 universities (ACM Multimedia 2020, [paper](https://arxiv.org/abs/2002.12186)). Cited in 50+ papers, it supports Drone → Satellite localization and Satellite → Drone navigation. The dataset includes drone, satellite, street, and 4K_drone images, along with building identifiers, view types, and split types. The dataset size is approximately 9.2GB (unzipped).
提供机构:
layumi
搜集汇总
数据集介绍

构建方式
University-1652数据集由72所大学的1652栋建筑构成,旨在为基于无人机的跨视角地理定位提供基准。其构建过程系统性地采集了多种视角的图像,包括无人机航拍、卫星遥感、街景以及4K高清无人机影像。数据分为训练集和测试集,训练集涵盖33所大学的约5万张图像,测试集则进一步细分为查询与图库子集,分别对应无人机、卫星和街景等不同检索任务。每个样本均标注了建筑标识符、视角类型和数据集划分属性,确保了多模态地理定位研究的可复现性。
特点
该数据集的核心特点在于其多视角融合与跨域检索能力。它支持从无人机视角到卫星视角的定位任务,以及从卫星视角到无人机视角的导航任务,填补了跨视角地理定位领域的空白。数据集规模达9.2GB,包含超过14.6万张图像,其中测试集精心划分为六个子集,以模拟真实场景下的查询与检索流程。此外,其标注信息清晰,视角类型涵盖无人机、卫星、街景和4K高清四种模态,为多源图像匹配与定位研究提供了丰富的实验基础。
使用方法
使用University-1652数据集时,可通过Hugging Face的datasets库便捷加载。用户只需调用`load_dataset`函数并指定数据集名称及所需划分(如训练集或测试集),即可获取包含图像路径、建筑标识符、视角类型和划分类型等字段的样本。该数据集兼容计算机视觉领域的常见框架,适用于训练和评估跨视角地理定位模型。研究者可根据任务需求,灵活选取特定视角子集进行实验,例如利用无人机查询图像在卫星图库中检索对应建筑,或反向验证导航精度。
背景与挑战
背景概述
University-1652数据集诞生于2020年,由澳大利亚阿德莱德大学等机构的研究人员构建,发表于ACM Multimedia 2020。该数据集聚焦于无人机视角下的地理定位任务,核心研究问题在于如何通过多视角图像(包括无人机、卫星、街景等)实现跨视角的建筑物识别与匹配。数据集标注了来自72所大学的1652栋建筑物,包含约9.2GB的图像数据,训练集涵盖33所大学,测试集则覆盖其余39所大学,形成了严谨的跨域评估体系。这一数据集的提出填补了无人机-卫星跨视角地理定位领域的空白,为后续研究提供了标准化的基准,其影响力体现在被50余篇学术论文引用,推动了无人机导航、遥感图像检索等方向的发展。
当前挑战
University-1652所解决的领域挑战在于跨视角图像匹配中的视角差异问题——无人机、卫星和街景图像在拍摄角度、光照条件和分辨率上存在显著差异,使得传统图像检索方法难以直接应用。构建过程中面临的核心挑战包括:1)数据采集的复杂性,需协调多所大学、多种设备(无人机、卫星、街景相机)获取统一标注的建筑物图像;2)跨域标注的一致性,确保不同视角下同一建筑物的标识准确无误,避免因视角变化导致的误匹配;3)数据规模与平衡性,测试集中查询图像与检索图像的比例(如无人机查询37555张对应检索51355张)需精心设计,以模拟真实场景中的定位难度,同时保证评估结果的统计可靠性。
常用场景
经典使用场景
University-1652数据集专为无人机视角下的地理定位任务而设计,其最经典的使用场景是跨视角图像检索。研究者利用该数据集,将无人机拍摄的建筑物图像与卫星视角的参考图像进行匹配,从而精准定位无人机的位置。该数据集涵盖72所大学的1652栋建筑,提供了无人机、卫星、街景及4K无人机等多种视角的图像,为多模态地理定位研究提供了标准化的评测基准。
实际应用
在实际应用中,University-1652数据集支撑了无人机物流配送、城市安防监控和灾后快速搜救等场景。例如,无人机在GPS信号弱的城市峡谷中,可通过拍摄建筑图像与卫星数据库比对,实现厘米级定位修正。此外,该数据集还助力于自动驾驶车辆在无地图区域通过空中视角辅助地面定位,以及军事侦察中无人机对目标建筑的精确定位。
衍生相关工作
该数据集催生了多项经典工作,包括基于注意力机制的跨视角特征融合方法(如LPN网络)、生成对抗网络用于视角转换的GeoGAN,以及结合图神经网络的多尺度地理定位模型。后续研究还拓展了动态场景下的时序地理定位任务,并衍生出如University-1652-X跨域扩展版本,推动了地理定位领域从静态匹配向动态感知的演进。
以上内容由遇见数据集搜集并总结生成



