无人机声学签名数据集

Name: 无人机声学签名数据集
Creator: 查尔斯顿学院计算机科学系
Published: 2025-09-05 08:04:29
License: 暂无描述

arXiv2025-09-05 更新2025-09-09 收录

下载链接：

https://mackenzie-jane.github.io/drone-visualization/

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由查尔斯顿学院计算机科学系的研究人员创建，包含32种不同品牌和型号的无人机的声学签名。数据集包括原始音频录音、频谱图和梅尔频率倒谱系数（MFCC）图。此外，还介绍了一个交互式网络应用程序，允许用户通过选择特定的无人机类别、收听相关的音频并查看相应的频谱图和MFCC图来探索此数据集。该工具旨在促进无人机检测、分类和声学分析的研究，支持技术进步和教育计划。

Created by researchers from the Department of Computer Science at the College of Charleston, this dataset encompasses acoustic signatures of 32 distinct drone brands and models. The dataset includes raw audio recordings, spectrograms, and Mel-Frequency Cepstral Coefficients (MFCC) plots. Furthermore, an interactive web application is introduced, which enables users to explore this dataset by selecting specific drone categories, listening to associated audio clips, and viewing the corresponding spectrograms and MFCC plots. This tool is designed to advance research in drone detection, classification, and acoustic analysis, and support technological advancements and educational initiatives.

提供机构：

查尔斯顿学院计算机科学系

创建时间：

2025-09-05

搜集汇总

数据集介绍

构建方式

无人机声学签名数据集的构建采用了多地点、多环境下的系统性采集策略，涵盖美国印第安纳州与南卡罗来纳州的室内外场景，包括大学实验室、农场及停车场屋顶等真实环境。数据采集历时多年，使用MacBook Air内置麦克风录制原始音频，未采用外部设备或后处理技术，确保声学特征的纯粹性。共收录32类无人机型号的3200段五秒音频，每类100段，包含四旋翼、六旋翼及定制机型，兼顾商业消费级与科研专用设备，背景噪声如风声、鸟鸣与交通声均被自然保留，构建出高生态效度的声学样本库。

特点

该数据集的核心特点在于其多模态结构与类别多样性，不仅提供原始音频波形，还包含声谱图与梅尔频率倒谱系数（MFCC）两种可视化特征，形成声学-视觉双维度表征。32类无人机覆盖主流品牌如DJI、Autel及定制机型，包含28种四旋翼、1种三旋翼、2种六旋翼与1种尾坐式无人机，兼具规模性与代表性。数据采集环境跨越室内外场景，自然融入环境噪声，增强了数据在真实场景下的适用性。MFCC特征采用Librosa库标准化提取，参数设定为20阶系数、2048帧长与512跳跃长度，确保特征一致性且兼容机器学习流程。

使用方法

该数据集可通过交互式网页应用进行探索，用户可选择特定无人机类别，聆听音频样本并同步观察声谱图与MFCC图谱的动态呈现。研究者可利用原始音频文件进行声学检测算法开发，或基于预提取的MFCC与声谱图特征训练深度学习模型，适用于无人机分类、噪声分析与异常检测等任务。数据集支持多模态融合研究，例如将音频转换为图像输入视觉模型（如EfficientNet、ResNet），亦可用于教育场景中声学原理的直观教学。所有数据与工具均开源提供，包含结构化JSON元数据与GitHub代码库，便于集成至现有研究管道或课程设计中。

背景与挑战

背景概述

随着无人机技术在物流、安防及农业领域的广泛应用，其引发的隐私安全与噪声污染问题日益凸显。2025年，查尔斯顿学院计算机科学系的Mia Y. Wang团队联合多学科研究者，针对传统视觉与雷达探测技术在复杂环境中的局限性，构建了涵盖32类无人机品牌的声学签名数据集。该数据集包含原始音频、声谱图及梅尔频率倒谱系数（MFCC）可视化数据，旨在推动声学探测算法的创新，并为跨学科研究提供标准化基准。

当前挑战

该数据集需解决声学分类中环境噪声干扰、多机型声纹相似性高等核心问题，其构建过程面临三大挑战：一是需在真实环境中采集高保真音频，克服风噪与电磁干扰；二是需设计标准化预处理流程，确保MFCC特征在不同硬件设备下的可比性；三是需建立交互式可视化平台，平衡数据复杂度与用户可操作性，以支持科研与教育应用。

常用场景

经典使用场景

在无人机声学检测领域，该数据集被广泛用于构建和验证基于机器学习的分类模型。研究者通过提取梅尔频率倒谱系数和声谱图特征，训练卷积神经网络和循环神经网络，实现不同品牌和型号无人机的精准识别。这种声学指纹分析方法在复杂环境背景下展现出显著优势，为多模态检测系统提供可靠的数据支撑。

衍生相关工作

基于该数据集衍生的经典工作包括Kim等人提出的自监督对比学习框架，实现了未见型号无人机的零样本分类；Wang团队开发的混合特征融合网络将分类准确率提升至98.7%；另有研究将声学特征转换为视觉模态，通过EfficientNet架构实现96.31%的跨模态识别性能，开创了声纹可视化分析的新范式。

数据集最近研究