five

TartanAviation

收藏
arXiv2024-03-06 更新2024-06-21 收录
下载链接:
https://theairlab.org/tartanaviation/
下载链接
链接失效反馈
官方服务:
资源简介:
TartanAviation是一个专注于终端空域操作的多模态开源数据集,由卡内基梅隆大学机器人学院创建。该数据集通过在机场边界内安装的设备,同时收集图像、语音和ADS-B轨迹数据,全面展示了机场环境。数据集包含310万张图像、3374小时的空中交通控制语音数据和661天的ADS-B轨迹数据,涵盖了多种飞机操作、季节、飞机类型和天气条件。创建过程中,数据经过过滤、处理和验证,确保了数据集的质量。TartanAviation的应用领域广泛,特别是在集成AI和机器学习技术到空中交通控制系统中,以及推动自主飞机在空域中的应用方面具有重要价值。

TartanAviation is a multimodal open-source dataset focused on terminal airspace operations, created by the Robotics Institute at Carnegie Mellon University. This dataset collects images, speech, and ADS-B trajectory data simultaneously via devices installed within airport boundaries, comprehensively depicting airport environments. The dataset contains 3.1 million images, 3,374 hours of air traffic control speech data, and 661 days of ADS-B trajectory data, covering diverse aircraft operations, seasons, aircraft types, and weather conditions. During its creation, the data underwent filtering, processing, and validation to ensure high dataset quality. TartanAviation has a wide range of application scenarios, and is particularly valuable for integrating AI and machine learning technologies into air traffic control systems, as well as promoting the deployment of autonomous aircraft in airspace.
提供机构:
卡内基梅隆大学机器人学院
创建时间:
2024-03-06
搜集汇总
数据集介绍
main_image_url
构建方式
在终端空域操作领域,TartanAviation数据集的构建采用了多模态同步采集策略。通过在机场边界内部署定制化设备,系统性地捕获图像、语音和ADS-B轨迹数据。图像数据通过索尼IMX264相机阵列以24帧每秒的速率采集,触发机制基于ADS-B数据设定的8公里地理围栏。轨迹数据利用Stratux接收器记录1090MHz和978MHz频段的ADS-B信号,语音数据则通过Bearcat SR30C无线电接收器捕获空中交通管制通信。所有数据均经过严格过滤、处理和验证,确保数据质量与一致性。
特点
TartanAviation数据集以其多模态集成与真实场景多样性著称。该数据集涵盖3.1百万张图像、3374小时空中交通管制语音数据以及661天的ADS-B轨迹数据,全面呈现终端空域运行状态。其独特之处在于同步采集三种模态数据,并聚焦于小型区域机场,覆盖不同季节、天气条件和航空器类型,包括单引擎、多引擎飞机及旋翼机。数据集还提供丰富的元数据,如气象信息和精细化标注,为复杂环境下的算法研究提供了坚实基础。
使用方法
该数据集支持独立或联合使用各模态数据,适用于计算机视觉、语音识别和轨迹预测等多种任务。用户可通过官方提供的高吞吐量服务器下载数据,并利用随附的PyTorch数据加载器进行集成。数据集采用社区通用格式组织,便于与现有算法框架对接。研究人员可基于图像数据开展远程目标检测研究,利用语音数据探索多模态语音转文本技术,或结合轨迹数据分析空域运行模式。数据分块下载脚本允许在本地或大型服务器上灵活处理,促进广泛的研究与应用。
背景与挑战
背景概述
随着航空运输量的持续增长,终端空域作为飞行起降的关键区域,其高密度交通流对空中交通管理系统提出了严峻挑战。TartanAviation数据集由卡内基梅隆大学机器人研究所等机构于2024年发布,旨在通过融合视觉、语音与ADS-B轨迹等多模态数据,为终端空域运行提供全景视角。该数据集聚焦于区域机场环境,涵盖不同季节、天气条件与航空器类型,其核心研究问题在于如何利用多源数据提升空域容量与安全性,并为人工智能技术在自主航空器与空中交通管制系统的集成奠定数据基础。
当前挑战
在解决终端空域运行的多模态感知与决策问题上,TartanAviation面临诸多挑战:视觉数据需在复杂气象条件下实现远距离航空器检测,语音数据需克服无线电通信中的噪声干扰以实现精准的语音转文本与意图理解,轨迹数据则需应对高密度空域中多航空器轨迹预测与异常检测的复杂性。构建过程中,数据采集需协调多传感器同步触发与长期部署,标注工作依赖半自动流程与人工验证以确保准确性,多模态数据对齐与融合亦需克服时空同步与校准难题。
常用场景
经典使用场景
在航空交通管理领域,TartanAviation数据集为终端空域的多模态研究提供了前所未有的实验平台。该数据集最经典的应用场景在于支持视觉检测与避让系统的算法开发,通过大规模真实场景图像数据,研究人员能够训练和验证在复杂气象条件下对远距离飞行器的鲁棒识别模型。同时,其同步采集的语音与轨迹数据为多模态意图理解系统构建了天然测试环境,使得算法能够从管制员与飞行员的通信中提取操作意图,并与实际飞行轨迹进行关联分析。
解决学术问题
TartanAviation有效解决了航空人工智能研究中数据稀缺与模态割裂的核心难题。在学术层面,该数据集为小目标检测算法提供了涵盖雨雪、低云、多变光照等挑战性条件的评估基准,推动了计算机视觉在远距离航空器感知领域的理论进展。其多模态特性促进了语音-轨迹跨模态学习框架的发展,使研究者能够探索通信语义与飞行行为之间的深层关联。此外,数据集包含的塔台与非塔台机场数据,为不同运行规则下的轨迹预测与异常检测模型提供了对比研究基础。
衍生相关工作
基于TartanAviation数据集,已衍生出多个具有影响力的研究方向与经典工作。在视觉感知领域,研究者利用其丰富的标注数据开发了专用于航空器长距离跟踪的深度学习架构,如AirTrack系统,显著提升了复杂背景下的检测精度。多模态学习方面,该数据集催生了结合语音指令与ADS-B轨迹的意图预测模型,为理解管制员-飞行员交互逻辑提供了新范式。此外,数据集扩展了先前TrajAir项目的时空覆盖范围,促进了终端区轨迹预测算法在更大时间跨度与更多机场类型上的泛化能力验证,形成了从单模态分析到多模态融合的完整研究链条。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作