LAE UAV dataset
收藏arXiv2025-04-25 更新2025-05-08 收录
下载链接:
https://github.com/fangzr/TOC-Edge-Aerial
下载链接
链接失效反馈官方服务:
资源简介:
LAE UAV数据集由香港城市大学香港JC STEM智慧城市实验室与计算机科学系以及中国北京航空航天大学的研究团队创建,旨在模拟低空经济(LAE)中的真实城市GNSS拒止场景。该数据集包含357,690帧图像,其中包括对齐的RGB、深度和语义视图。数据集的创建过程采用了多摄像头无人机系统,用于捕获多方向视图,并提取紧凑的多视图特征。LAE UAV数据集适用于研究视觉导航、信息瓶颈、边缘推理和任务导向通信等领域,旨在解决低空经济中无人机在GPS信号不可用环境下的精确定位问题。
The LAE UAV Dataset was created by research teams from the Hong Kong JC STEM Smart City Laboratory and Department of Computer Science at City University of Hong Kong, as well as Beihang University in Beijing, China. It is intended to simulate realistic urban GNSS-denied scenarios in the Low-Altitude Economy (LAE). This dataset contains 357,690 image frames, including aligned RGB, depth and semantic views. The dataset was developed using a multi-camera UAV system to capture multi-directional views and extract compact multi-view features. The LAE UAV Dataset is applicable to research on visual navigation, information bottleneck, edge inference and task-oriented communication, and aims to address the precise positioning problem of UAVs in GPS-unavailable environments within the Low-Altitude Economy.
提供机构:
香港城市大学香港JC STEM智慧城市实验室与计算机科学系, 中国北京航空航天大学
创建时间:
2025-04-25
搜集汇总
数据集介绍

构建方式
LAE UAV数据集构建于CARLA仿真环境中,旨在模拟城市环境中GNSS信号缺失的无人机飞行场景。数据采集过程中,无人机沿道路航点以恒定高度飞行,随机改变方向,通过搭载的五摄像头系统同步捕获多视角RGB、语义及深度图像,分辨率统一为400×300像素。该数据集共收录357,690帧严格对齐的多模态图像,每帧均标注精确的位姿坐标,并通过物理测试平台验证了数据的实际部署可行性。数据生成流程采用模块化设计,涵盖场景建模、传感器仿真、自动标注三个核心环节,确保了数据分布的多样性和标注一致性。
特点
该数据集的核心特征体现在多模态、高精度与任务导向三个维度。多模态方面,每帧数据包含五视角(前、后、左、右、下)的RGB-深度-语义三通道同步观测,构建了全景式的环境表征体系。高精度特性反映在厘米级标注精度与严格时空对齐的传感器数据,其中位姿真值通过仿真引擎的物理坐标系直接导出。任务导向设计表现为数据专门针对视觉定位任务优化,通过模拟典型城市峡谷效应、动态遮挡等GNSS拒止场景,强化了模型在复杂环境下的鲁棒性。数据集还创新性地集成了无线信道模型参数,支持端到端通信-计算协同效能的联合评估。
使用方法
该数据集支持无人机视觉定位算法的全流程开发与评估。使用时应遵循多阶段处理流程:首先加载经时间戳对齐的多视角图像序列与位姿标签,通过CLIP视觉编码器提取标准化特征张量;继而采用O-VIB编码器进行任务导向的特征压缩,将512维多视图特征降维至32-128维的紧凑表示;最终通过边缘服务器的注意力融合模块实现位姿估计。评估阶段需计算欧氏距离误差指标,并分析不同带宽约束下的定位精度-延迟权衡曲线。数据集兼容PyTorch/TensorFlow框架,提供数据加载器、基准模型及评估脚本,支持仿真环境与真实硬件平台的跨域验证。
背景与挑战
背景概述
LAE UAV dataset是由香港城市大学和北京航空航天大学的研究团队于2025年提出的一个专注于低空经济(LAE)场景下无人机视觉导航任务的数据集。该数据集旨在解决城市环境中GPS信号缺失时无人机的精确定位问题,包含357,690帧多视角(前、后、左、右、下)对齐的RGB、深度和语义图像,模拟了复杂的城市GNSS拒止场景。数据集的核心创新在于其任务导向的通信框架设计,通过边缘-空中协作机制,将计算密集型定位任务卸载到边缘服务器,显著降低了轻量化无人机平台的资源消耗。这一工作为低空经济中的货运配送、交通监控等应用提供了关键技术支撑,并推动了视觉-边缘协同定位领域的研究进展。
当前挑战
LAE UAV数据集面临的主要挑战体现在两个维度:领域问题层面,需解决多视角特征冗余压缩与带宽受限条件下的定位精度平衡问题,传统视觉SLAM方法因计算资源限制难以实时运行;数据构建层面,多传感器(五摄像头+深度+语义)数据的时间-空间对齐、大规模城市场景的多样性覆盖,以及仿真环境(CARLA)到真实硬件部署(Jetson Orin NX)的域适应问题构成显著挑战。此外,边缘服务器端的几何特征数据库构建需克服动态环境下的地图更新与跨视角特征匹配难题,这对数据标注的精确性和系统延迟控制提出了极高要求。
常用场景
经典使用场景
LAE UAV数据集在无人机视觉导航领域具有重要应用价值,特别是在全球定位系统(GNSS)信号缺失的复杂城市环境中。该数据集通过多视角摄像头系统捕获RGB、深度和语义图像数据,为无人机提供精确的定位信息。其经典使用场景包括无人机在城市峡谷、高楼密集区域或其他GNSS信号受限环境中的自主导航任务。数据集的多视角特性使研究人员能够模拟真实飞行场景中的视觉感知挑战,为算法开发提供丰富的测试环境。
解决学术问题
该数据集有效解决了无人机在GNSS信号缺失环境中的精确定位问题,为视觉导航算法研究提供了关键数据支持。通过提供多视角对齐的视觉数据,数据集帮助研究人员克服传统视觉SLAM方法在资源受限无人机平台上的计算瓶颈。数据集还促进了任务导向通信(TOC)框架的发展,使无人机能够在有限带宽条件下实现高效特征传输和边缘计算协同,为低空经济(LAE)应用中的无人机自主导航提供了新的解决方案。
衍生相关工作
基于LAE UAV数据集,研究人员已开展多项重要工作。其中包括开发正交约束变分信息瓶颈编码器(O-VIB),该编码器通过自动相关性确定(ARD)机制和正交约束实现了高效特征压缩。数据集还促进了边缘-空中协作框架的发展,相关研究探索了多智能体轨迹规划和联邦计算卸载等技术。这些工作不仅提升了无人机视觉导航的性能,也为6G时代的低空经济基础设施提供了关键技术支撑。
以上内容由遇见数据集搜集并总结生成



