five

Real-world Commercial WiFi and Bluetooth Dataset for RF Fingerprinting

收藏
arXiv2023-08-17 更新2024-06-21 收录
下载链接:
https://dx.doi.org/10.21227/618k-c392
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集名为‘Real-world Commercial WiFi and Bluetooth Dataset for RF Fingerprinting’,由马可尼-罗森布拉特AI/ML创新实验室创建。数据集包含从10个商用物联网芯片组捕获的WiFi和蓝牙信号,总计120条记录,覆盖多种信号强度和时间框架。创建过程中,研究人员在不同的室内环境中使用被动接收器捕获信号,确保数据的真实性和多样性。该数据集主要用于RF指纹识别研究,旨在解决物联网设备的安全性和身份验证问题,支持深度学习模型在实际环境中的应用和验证。

This dataset is named "Real-world Commercial WiFi and Bluetooth Dataset for RF Fingerprinting", and was created by the Marconi-Rosenblatt AI/ML Innovation Lab. It contains WiFi and Bluetooth signals captured from 10 commercial IoT chipsets, with a total of 120 records covering a wide range of signal strengths and time frames. During the data collection process, researchers used passive receivers to capture signals across various indoor environments, ensuring the authenticity and diversity of the dataset. This dataset is primarily intended for RF fingerprinting research, aiming to address the security and authentication issues of IoT devices, and support the application and validation of deep learning models in real-world scenarios.
提供机构:
马可尼-罗森布拉特AI/ML创新实验室
创建时间:
2023-03-15
搜集汇总
数据集介绍
构建方式
在射频指纹识别领域,真实世界数据集的稀缺制约了算法的实际部署。为此,本研究构建了一个涵盖商用物联网组合芯片的射频数据集,采集环境设定为室内实验室,以模拟真实无线传播条件。数据采集采用被动接收方式,使用配备UBX160子板和VERT2450天线的USRP X300软件定义无线电,以66.67 MS/s的采样率捕获信号。发射端包括8台树莓派4B和2台联想笔记本电脑,均搭载支持WiFi与蓝牙的双模芯片。为确保数据多样性,采集过程覆盖了不同时间框架(相隔数月)、多种信号强度(通过调整发射功率与收发距离实现)以及两种通信协议(WiFi IEEE 802.11g与蓝牙5.0)。每个捕获文件包含4000万采样点,并以原始IQ样本形式存储,辅以详细的JSON元数据文件,完整记录了发射器、接收器及环境参数。
特点
该数据集的核心特征在于其真实性与异构性。作为首个公开的商用组合芯片射频数据集,它同时包含来自同一硬件的WiFi与蓝牙发射信号,为研究多协议射频指纹识别提供了独特资源。数据集规模达72GB,每个捕获样本长度充足,支持用户根据需求灵活截取不同长度的输入张量。此外,数据采集跨越两个不同时间框架,能够有效反映设备老化、传播信道变化等现实因素,为模型泛化能力评估提供了坚实基础。数据集还涵盖了从微弱到强劲的多种信号强度,模拟了真实环境中的信号波动。所有数据均以原始IQ样本格式提供,保留了完整的射频特征,便于用户进行自定义预处理或特征提取。
使用方法
该数据集适用于训练与评估面向物联网安全的射频指纹识别模型,如设备认证、入侵检测等。用户可通过解析配套的JSON元数据文件获取采集参数,并读取相应的.dat二进制文件以加载原始IQ样本。由于样本长度大且为原始数据,研究者能够自由实施自定义预处理,例如提取幅度、相位、功率谱密度或进行时频变换,以适配不同的深度学习架构。数据集按时间框架(Day-1与Day-2)进行组织,便于设计单日或混合日训练测试方案,以严格检验模型在时变环境下的泛化性能。对于多任务学习场景,元数据中提供的协议、发射器标识等标注信息可用于联合学习WiFi与蓝牙的指纹特征。该数据集既支持资源受限的边缘设备部署轻量级模型,也可为高性能服务器上的复杂模型提供充足数据。
背景与挑战
背景概述
随着物联网设备的广泛普及,无线通信安全面临严峻挑战,射频指纹识别作为一种物理层安全机制,通过识别发射机硬件电路固有缺陷形成的独特射频特征,为设备认证与入侵检测提供了新途径。2022年,由ANDRO计算解决方案公司Marconi-Rosenblatt人工智能/机器学习创新实验室与多所高校联合发布的Real-world Commercial WiFi and Bluetooth Dataset,首次采集了商用组合芯片在真实环境中的WiFi与蓝牙异构信号,填补了该领域缺乏公开实测数据的空白。该数据集涵盖10个商用物联网设备在不同时间跨度、多种信号强度下的发射样本,总容量达72GB,旨在推动面向实际部署场景的射频指纹识别算法研究,对提升物联网安全架构的鲁棒性具有重要价值。
当前挑战
在射频指纹识别领域,核心挑战在于算法需在复杂多变的真实环境中保持高泛化能力,以区分相同制造商生产的设备发射的相似波形,并克服信号传播中的多径效应与干扰。数据集的构建过程面临多重困难:首先,采集商用组合芯片的双模信号需精确控制发射时序,避免WiFi与蓝牙同时激活造成的相互干扰;其次,为模拟真实场景中的设备老化与信道变化,必须在不同时间帧下进行长期采集,这引入了接收机电路老化与传播环境变异等混杂因素;此外,数据集需保留原始IQ样本以支持多样化的预处理方法,对存储容量与数据标注的完整性提出了较高要求。
常用场景
经典使用场景
在无线物理层安全领域,射频指纹识别技术正成为区分合法与非法发射源的关键手段。该数据集通过采集真实环境中商用物联网组合芯片的WiFi与蓝牙异构信号,为研究者提供了评估射频指纹识别模型泛化能力的基准平台。其最经典的应用场景在于训练深度学习模型,使其能够准确识别同一硬件设备在不同通信协议下的独特射频特征,从而验证模型在跨协议场景下的鲁棒性。
衍生相关工作
基于该数据集,研究社区已衍生出多项经典工作。例如,Jagannath等人利用其开发了注意力机制驱动的多任务深度学习框架,同时处理WiFi与蓝牙的射频指纹识别,显著提升了跨协议识别精度。此外,该数据集还促进了针对设备老化泛化问题的研究,推动了如时频变换特征提取、短样本训练策略等方法的创新,为轻量化边缘部署模型的设计提供了宝贵的数据基础。
数据集最近研究
最新研究方向
在物联网安全领域,射频指纹识别作为一种物理层安全机制,正面临从理论验证向实际部署的关键转型。该数据集通过采集商用组合芯片在真实环境中发射的WiFi与蓝牙异构波形,首次为多协议射频指纹泛化研究提供了实证基础。前沿探索聚焦于跨时间帧的模型泛化能力评估,旨在解决设备老化、传播信道变化等现实因素对指纹稳定性的影响。同时,数据集支持多任务学习框架的开发,使算法能够准确识别发射器身份而非仅依赖特定通信协议,这对于笔记本电脑、移动设备等广泛采用组合芯片的物联网终端身份认证具有重要意义。其长样本原始IQ数据格式进一步推动了轻量化边缘部署与复杂深度学习架构的协同演进,为构建适应动态无线环境的鲁棒安全系统提供了关键数据支撑。
相关研究论文
  • 1
    Bluetooth and WiFi Dataset for Real World RF Fingerprinting of Commercial Devices马可尼-罗森布拉特AI/ML创新实验室 · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作