five

ATC-EnRoute-Synthetic-Dataset

收藏
Hugging Face2026-06-30 更新2026-07-01 收录
下载链接:
https://huggingface.co/datasets/Joseagl14/ATC-EnRoute-Synthetic-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
ATC En-Route Synthetic Dataset 是一个合成的空中交通管制通信数据集,专为航路(巡航)阶段的训练和评估而设计。数据集包含初始联系和操作指令(如航向、速度、高度变化),总时长约为3小时25分钟。数据以同步的立体声音频轨道和CSV元数据格式提供,其中元数据包括文本转录、说话者、目标呼号(target_callsign)和意图(intent)等字段。该数据集的生成源于学士论文《基于语音识别和机器学习的ATC人工智能助手开发》,适用于音频分类和自动语音识别等任务。

The ATC En-Route Synthetic Dataset is a synthetic air traffic control communication dataset designed for training and evaluation during the en-route (cruise) phase. It includes initial contacts and operational instructions (such as heading, speed, and altitude changes), with a total duration of approximately 3 hours and 25 minutes. The data is provided in synchronized stereo audio tracks and CSV metadata format, with metadata fields including text transcription, speaker, target callsign, and intent. This dataset was generated from the bachelors thesis Development of an ATC AI Assistant Based on Speech Recognition and Machine Learning and is suitable for tasks such as audio classification and automatic speech recognition.
创建时间:
2026-06-26
原始信息汇总

数据集概述

ATC En-Route Synthetic Dataset 是一个合成的空中交通管制(ATC)通信数据集,专为航路(巡航)阶段的训练和评估而设计。

基本信息

  • 许可证: MIT
  • 任务类型: 音频分类、自动语音识别
  • 总时长: 约3小时25分钟

数据内容

  • 通信场景: 初始联系及操作指令(航向、速度、高度变化)
  • 数据格式: 同步立体声音频轨道及CSV元数据

数据特征

数据集包含以下字段:

  • text: 文本内容
  • speaker: 说话人
  • target_callsign: 目标呼号
  • intent: 意图

用途

该数据集用于学士论文《基于语音识别和机器学习的ATC人工智能助手开发》。

生成代码

生成该数据集的代码可在GitHub上获取:https://github.com/Joseagl14/ATC-Synthetic-Data-Generator

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于语音合成与自动化脚本技术,面向航空交通管制(ATC)巡航阶段场景构建而成。通过定制化的数据生成器,将预定义的初始呼叫、航向调整、速度变更及高度变化等标准化指令语句,与模拟的飞行员与管制员身份标签、目标呼叫标识及意图类别字段相结合,产出同步的双声道立体声录音与结构化CSV元数据文件。生成流程依托GitHub开源仓库提供的代码框架,实现了从文本到语音及标注信息的端到端自动化流水线,确保样本的多样性与领域语义一致性。
使用方法
适用于音频分类与自动语音识别两类核心任务。使用时,可直接通过Hugging Face Datasets库加载音频波形与文本标注,将'text'字段作为语音识别模型的转录目标,或利用'speaker'、'intent'等分类标签训练指令识别系统。建议将数据划分为训练、验证与测试子集,并利用元数据中的时序信息对齐音频与语义单元。对于下游应用,可基于该数据集微调预训练的Transformer编码器,实现面向ATC指令的端到端语音理解,或将其作为域适应预训练的辅助语料。
背景与挑战
背景概述
航空交通管制(ATC)通信是保障飞行安全的核心环节,尤其在航路(巡航)阶段,飞行员与管制员之间的指令交换高度依赖清晰、标准化的语音交互。然而,真实ATC数据因隐私、安全及标注成本高昂而难以获取,这限制了语音识别(ASR)与分类模型在该领域的发展。为应对这一瓶颈,ATC-EnRoute-Synthetic-Dataset于近期由研究人员Joseagl14及其团队在学士论文《Development of an AI Assistant for ATC based on Speech Recognition and Machine Learning》中创建。该数据集包含约3小时25分钟的合成ATC通信对,涵盖初始联系、航向、速度及高度变更等操作指令,以同步立体声和CSV元数据格式呈现,为航路阶段AI辅助系统的构建提供了关键训练资源。其开源属性(MIT许可证)与配套生成代码进一步推动了ATC语音技术的标准化研究。
当前挑战
该数据集所应对的领域核心挑战在于:真实ATC语音数据的高敏感性与稀缺性,导致基于监督学习的ASR和音频分类模型难以在航路通信场景中实现鲁棒性能,尤其是面对口音、背景噪声及非标准表达时。此外,数据集的构建亦面临双重技术难点:一是合成语音需精准模拟真实管制员与飞行员的术语复用、语速变化及通信规程,避免因过度简化而偏离实际场景;二是需确保多通道音频与文本元数据的时间同步保真度,以支持后续时间对齐的细粒度分析。这些挑战共同决定了数据集在平衡逼真度、规模与可用性上的设计取舍。
常用场景
经典使用场景
在航空交通管理(ATM)研究领域,ATC-EnRoute-Synthetic-Dataset作为一套专门针对航路巡航阶段设计的合成航空管制通信数据集,其经典使用场景集中在语音识别与意图理解模型的训练与评估。该数据集包含约3小时25分钟的同步立体声录音与CSV元数据,覆盖了初始联系、航向调整、速度变更及高度切换等典型管制指令,为研究者提供了高保真度的模拟通信环境,用于开发能够处理真实ATC嘈杂语音与专业术语的端到端系统。
解决学术问题
该数据集有效解决了航空通信领域两个核心学术问题:一是缺乏公开可用的、标注详尽的航路阶段语音数据,导致基于深度学习的管制指令识别研究受限;二是真实ATC数据获取成本高昂且涉及隐私与安全约束,难以用于可重复的实验验证。通过提供合成数据,它使研究者能够在受控条件下探索语音识别模型对专业术语、口音差异及背景噪声的鲁棒性,推动自动语音识别(ASR)与意图分类技术在航空安全关键型应用中的理论进步。
实际应用
在实际应用层面,该数据集直接服务于开发面向空中交通管制员的智能决策支持系统。基于所训练的模型,系统能够实时转录飞行员与管制员的语音通信,自动提取关键指令(如目标呼号、操作意图),从而减轻管制员的工作负荷,减少人为失误。此外,该技术可集成至飞行模拟器或无人机交通管理平台中,实现自动化通信监控与冲突检测,提升空域运行效率。
数据集最近研究
最新研究方向
ATC-EnRoute-Synthetic-Dataset聚焦于航空交通管制(ATC)领域中航路阶段的智能语音交互技术研究。当前前沿方向包括利用合成语音数据训练高鲁棒性的自动语音识别(ASR)与音频分类模型,以解析管制员与飞行员间的标准化通信指令(如航向、速度与高度变更)。该数据集紧密关联民用航空安全与自动化塔台辅助决策系统的热点需求,通过模拟巡航阶段的真实对话环境,弥补了真实ATC数据标注成本高、隐私限制严密的短板。其发布推动了基于机器学习的语音助手在空管场景下的端到端开发,为构建低资源、高保真的模拟训练平台提供了关键支撑,对未来降低人为通信失误、提升空域运行效率具有显著实践意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务