five

TRAVEL

收藏
github2025-02-28 更新2025-02-18 收录
下载链接:
https://github.com/prince687028/TravelUAV
下载链接
链接失效反馈
官方服务:
资源简介:
TRAVEL是一个面向真实无人机的视觉语言导航的平台、基准和方法的介绍。

TRAVEL is an introduction to platforms, benchmarks, and methods for vision-and-language navigation targeting real-world drones.
创建时间:
2025-02-07
原始信息汇总

数据集概述

数据集名称

TRAVEL: UAV VLN Platform, Benchmark, and Methodology

数据集简介

该数据集是一个面向真实无人机的视觉语言导航任务的平台、基准测试和方法的介绍。包含了无人机模拟平台、辅助引导的真实无人机视觉语言导航基准测试以及基于MLLM的方法。

数据集相关链接

依赖

  • Python 3.10
  • PyTorch 2.0.1
  • Torchvision 0.15.2
  • Torchaudio 2.0.2
  • LLaMA-UAV 模型
  • 其他依赖(见 requirements.txt)

准备数据

  • 构建数据集(见 Model/LLaMA-UAV/README.md#dataset)
  • 设置模型(见 Model/LLaMA-UAV/README.md)

使用方式

  1. 配置模拟环境服务器
  2. 运行闭路模拟

引用

@misc{wang2024realisticuavvisionlanguagenavigation, title={Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology}, author={Xiangyu Wang and Donglin Yang and Ziqin Wang and Hohin Kwan and Jinyu Chen and Wenjun Wu and Hongsheng Li and Yue Liao and Si Liu}, year={2024}, eprint={2410.07087}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2410.07087}, }

搜集汇总
数据集介绍
main_image_url
构建方式
TRAVEL数据集的构建采取了一套综合性的方法,涵盖了无人机的模拟平台、视觉语言导航的辅助引导型现实基准测试以及基于MLLM的导航方法。数据集的构建首先遵循了无人机的实际操作流程,通过模拟器环境生成了多样化的地图和场景,进而结合视觉语言任务构建了导航指令数据,旨在提供一个接近现实操作的无人机视觉语言导航测试平台。
特点
TRAVEL数据集显著的特点在于其现实性、多样性和综合性。它不仅包含了丰富的视觉场景和地图数据,而且融合了真实的导航指令,这些都是通过模拟器环境精心设计的。此外,该数据集还提供了辅助引导型基准测试,使得研究者在评估无人机视觉语言导航性能时有更为客观和全面的指标。
使用方法
使用TRAVEL数据集,研究者需要首先设置模拟器环境服务器,并确保AirSim环境服务器正确配置。之后,可以通过执行脚本进行闭环模拟,如dagger或evaluation脚本,以实现无人机的导航模拟和性能评估。详细的使用步骤包括环境配置、模型设置以及数据准备,这些都在官方文档中提供了详细的指导。
背景与挑战
背景概述
TRAVEL数据集,即面向真实无人机视觉语言导航的平台、基准与方法的探索,是由王祥宇等研究人员于2024年提出。该数据集旨在解决现实无人机视觉语言导航中的挑战,提供了一个无人机仿真平台、一个辅助引导的无人机视觉语言导航基准,以及一种基于MLLM的方法。TRAVEL数据集的发布,为无人机视觉语言导航领域提供了重要的实验资源,推动了相关技术的发展与应用。
当前挑战
TRAVEL数据集在构建过程中所面临的挑战主要包括:如何构建一个能够真实模拟无人机环境的仿真平台,如何设计一个能够有效评估无人机视觉语言导航性能的基准,以及如何开发一种能够适应复杂场景的导航方法。此外,该数据集在实际应用中还面临着如何提高导航的准确性和鲁棒性,以及如何处理大规模复杂数据的挑战。
常用场景
经典使用场景
TRAVEL数据集针对无人机视觉语言导航的领域,提供了一个辅助引导的实时无人机VLN基准,其经典的使用场景在于构建一个模拟平台,以评估和训练无人机在真实环境中的视觉语言导航能力。
实际应用
在实际应用中,TRAVEL数据集可用于开发和优化无人机自主导航系统,特别是在复杂和动态的环境中,如城市空中交通、灾害现场侦察等场景,提升无人机执行任务的安全性和效率。
衍生相关工作
基于TRAVEL数据集,研究者们已经开展了一系列相关工作,如开发新的无人机视觉语言导航模型、提出更高效的导航算法,以及构建更为逼真的无人机模拟环境,进一步推动了无人机视觉语言导航领域的研究进展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作