five

AeroSonicDB (YPAD-0523)

收藏
arXiv2023-11-11 更新2024-06-21 收录
下载链接:
https://zenodo.org/records/8371595
下载链接
链接失效反馈
官方服务:
资源简介:
AeroSonicDB (YPAD-0523) 数据集由Soundsensing AS创建,专注于低空飞行飞机声音的声学检测与分类。数据集包含625个飞机录音,时长从18秒到60秒不等,总计8.87小时飞机音频。此外,还包含3.52小时的背景环境音频和6小时的都市声景录音,用于模型性能评估。数据集通过ADSB无线电传输被动收集和标记音频样本,旨在解决环境噪音监测和飞机噪音分类问题,推动机器听觉领域的进步。

AeroSonicDB (YPAD-0523) was developed by Soundsensing AS, focusing on acoustic detection and classification of sounds produced by low-altitude aircraft. The dataset includes 625 aircraft audio recordings, with durations ranging from 18 seconds to 60 seconds, totaling 8.87 hours of aircraft audio. Additionally, it contains 3.52 hours of background ambient audio and 6 hours of urban soundscape recordings, which are used for model performance evaluation. The dataset passively collects and annotates audio samples via ADSB radio transmissions. It aims to address the challenges of environmental noise monitoring and aircraft noise classification, thereby advancing the field of machine hearing.
提供机构:
Blake Downward AeroSonicDB Soundsensing AS
创建时间:
2023-11-11
搜集汇总
数据集介绍
main_image_url
构建方式
在环境声学监测领域,高质量标注数据的稀缺性长期制约着飞机噪声检测与分类模型的精细化发展。AeroSonicDB (YPAD-0523) 的构建创新性地利用了自动相关监视广播(ADS-B)系统,通过软件定义无线电接收1090MHz频段的飞机广播信号,实时解码飞机的唯一识别码、位置与高度信息。当飞机进入预设地理围栏时,系统自动触发音频录制,从而实现了音频样本的被动采集与同步标注。随后,研究团队通过交叉验证公开航空数据库,为每架飞机补充了包括机型、发动机类型、制造商在内的14项元数据标签,并经过人工听辨验证与修剪,确保了数据质量与标注准确性。
特点
该数据集的核心特点在于其精细化的标注体系与真实场景的代表性。数据集收录了总计8.87小时的625段飞机音频事件,覆盖301架独特飞机,并辅以3.52小时的环境背景音(静默样本)以及6小时带标注的城市声景录音,为模型提供了区分飞机噪声与复杂环境声音的挑战。其标注粒度超越了常见的环境声音分类数据集,不仅包含二元分类标签,更提供了丰富的飞机属性元数据,如发动机类型、最大起飞重量等,支持细粒度的声学特征分析。数据采集于澳大利亚阿德莱德机场周边不同距离的三个地点,涵盖了从低空进近到中高空的多种飞行状态,增强了数据在噪声监测应用中的实用价值。
使用方法
该数据集主要用于训练和评估飞机声音的检测与分类机器学习模型。研究者可借助随数据集公开的Python脚本与Jupyter Notebook,从原始音频中提取梅尔频率倒谱系数等声学特征。数据集已预先划分为用于交叉验证的五个训练折和一个独立测试集,并提供了额外的环境评估集以模拟真实世界不平衡的类别分布。基线实验评估了逻辑回归、多层感知机和卷积神经网络等模型,其中卷积神经网络在应对复杂环境噪声时表现出较强的鲁棒性。该数据集为开发轻量级、可部署于边缘设备的实时飞机噪声监测系统提供了关键的训练与验证资源。
背景与挑战
背景概述
AeroSonicDB (YPAD-0523) 数据集由 Blake Downward 与 Jon Nordby 等研究人员于2023年发布,旨在推动机器听觉在环境声学分类领域的发展。该数据集聚焦于低空飞行器声音的检测与分类,通过利用自动相关监视广播(ADS-B)技术被动收集并标注音频样本,解决了传统音频数据标注耗时费力的问题。其核心研究问题在于为飞机噪声监测提供细粒度标注的专用数据集,以支持机场周边噪声管理的机器学习应用,对环境保护、公共健康及智能监测系统具有重要影响力。
当前挑战
该数据集面临的挑战主要体现在两方面:在领域问题层面,飞机噪声检测需在复杂环境声景中区分飞机引擎声与其他背景噪声(如道路交通),并应对不同机型、高度与飞行状态带来的声学特征变异;在构建过程中,挑战包括依赖ADS-B数据同步触发录音可能遗漏地面飞机噪声,采集静默样本时易受近距离环境干扰,以及数据标注需跨多个公开数据库进行飞机元数据验证与人工核查,确保样本质量与隐私保护。
常用场景
经典使用场景
在环境声学分类领域,AeroSonicDB数据集为低空飞行器声学检测与分类任务提供了精细标注的音频样本。该数据集通过结合ADS-B广播数据与同步音频采集,构建了包含625条飞机录音与背景环境音的标注语料库,其经典应用场景在于训练和评估二进制分类模型,以区分飞机噪声与城市环境背景音。研究人员利用该数据集提供的五秒音频片段与梅尔频率倒谱系数特征,能够系统性地开发并优化逻辑回归、多层感知机与卷积神经网络等模型,为机场噪声监测系统的算法研发奠定数据基础。
实际应用
在实际应用层面,该数据集支撑的声学检测系统可直接应用于机场周边噪声监测网络。通过部署基于嵌入式设备的实时推理模型,能够在不依赖雷达或ADS-B外部数据流的情况下,自主识别并记录飞机噪声事件,为社区噪声投诉验证与噪声影响评估提供客观依据。此外,系统可与声级计集成,形成低成本、易部署的噪声监测单元,用于验证机场噪声预测模型的准确性,或布设成传感器阵列以绘制城市尺度的噪声分布图。这类应用有助于民航管理部门优化航班起降路径,缓解飞机噪声对公众健康的影响。
衍生相关工作
基于该数据集的采集方法论与标注框架,衍生出了一系列关于声学事件实时识别与细粒度分类的经典研究工作。例如,Giladi等人提出的飞机声学事件实时识别方法被本数据集所借鉴并扩展,实现了ADS-B数据与音频采集的自动化同步。在无人机声学检测领域,Wang等人构建的大规模无人机音频数据集也采用了类似的主动触发采集策略。此外,数据集提供的环境评估子集与多模型基准测试框架,为后续研究如噪声鲁棒性增强、轻量化模型部署以及多传感器数据融合等方向提供了可复现的实验范式与性能对比基线。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作