LibIQ数据集
收藏arXiv2025-05-16 更新2025-05-20 收录
下载链接:
http://arxiv.org/abs/2505.10537v1
下载链接
链接失效反馈官方服务:
资源简介:
LibIQ数据集是一个包含超过35,200个时间序列的I/Q样本数据集,这些样本代表了六种不同的信号类型,并且跨越了四个中心频率。该数据集是通过一个运行在Colosseum网络模拟器和Over-The-Air (OTA)测试床上的自定义dApp收集的,用于5G部署。这些样本被用来训练一个卷积神经网络(CNN),以便在dApp中进行实时射频信号分类。数据集的创建过程包括了信号的收集、预处理和特征提取,以便CNN模型能够准确地对信号类型进行分类。LibIQ数据集的应用领域主要在于增强对无线电频率干扰(RFI)的检测和分类,从而提高攻击检测、动态资源管理和频谱共享的能力,保护第五代(5G)和更高代蜂窝网络的完整性。
The LibIQ dataset is a collection of over 35,200 time-series I/Q samples, which cover six distinct signal types and span four central frequencies. This dataset was collected via a custom dApp running on the Colosseum network simulator and Over-The-Air (OTA) testbed for 5G deployments. These samples were used to train a Convolutional Neural Network (CNN) for real-time radio frequency (RF) signal classification within the dApp. The dataset creation process comprises signal collection, preprocessing, and feature extraction, enabling the CNN model to accurately classify signal types. The primary application scenarios of the LibIQ dataset focus on enhancing the detection and classification of Radio Frequency Interference (RFI), thereby improving capabilities for attack detection, dynamic resource management, and spectrum sharing, and safeguarding the integrity of fifth-generation (5G) and beyond cellular networks.
提供机构:
意大利罗马第一大学, 美国东北大学无线互联网物联网研究所
创建时间:
2025-05-16
搜集汇总
数据集介绍

构建方式
LibIQ数据集的构建依托于先进的O-RAN架构,通过部署在分布式单元(DU)和集中式单元(CU)的dApp实时采集I/Q样本。研究团队在5G部署环境下,利用Colosseum网络仿真器和空中(OTA)测试平台,采集了六种信号类型(包括LTE、干扰信号、无射频干扰、方波、三角波和雷达信号)在四个中心频率下的35,200条时间序列数据。数据预处理阶段采用能量峰值检测器提取信号关键特征,最终形成包含实部、虚部、幅度和相位四维特征的标准化数据集。
特点
该数据集的核心价值在于其高精度实时频谱分类能力,包含三大显著特征:首先,采用时间窗口动态调整机制(1-15个样本可调),实现97.8%的平均分类准确率;其次,通过能量峰值检测器将原始1536维I/Q样本压缩至600维特征窗口,在保持信号完整性的同时提升计算效率;最后,数据集涵盖仿真环境与真实场景的双重验证,特别包含3.6042-3.6342GHz多频段信号,为O-RAN环境下的频谱共享研究提供多维度的基准数据。
使用方法
研究者可通过LibIQ库实现端到端的频谱分析流程:调用Analyzer模块解析二进制I/Q样本,利用Plotter生成时频域可视化图表,通过Preprocessor进行能量峰值检测和特征提取。分类阶段采用内置的CNN模型(含3层卷积和全局平均池化),输入维度为(32, J×K, 4)的批量数据,输出6类信号概率分布。实验表明,在10个训练周期(5500次权重更新)后,模型在2.23ms内即可完成单次预测,满足O-RAN亚10毫秒实时性要求。数据集特别适用于5G/6G网络中的动态频谱共享、干扰检测等边缘智能应用场景。
背景与挑战
背景概述
LibIQ数据集由意大利罗马萨皮恩扎大学和美国东北大学无线物联网研究所的研究团队于2025年联合创建,旨在解决开放无线接入网(O-RAN)架构中的实时频谱分类难题。该数据集基于分布式应用程序(dApps)概念,通过采集超过35,200组时域I/Q样本数据,覆盖六种信号类型和四种中心频率,为5G及未来网络的实时频谱监测与干扰检测提供了重要研究基础。其创新性在于首次将卷积神经网络(CNN)模型嵌入RAN单元,实现了97.8%的频谱分类准确率,显著推动了O-RAN架构中实时控制环路的技术发展。
当前挑战
LibIQ数据集面临双重技术挑战:在领域问题层面,需解决O-RAN架构中用户平面数据实时处理延迟超过10ms的瓶颈,以及隐私保护约束下的原始信号数据访问限制;在构建过程中,需克服多测试环境(网络仿真器与空中测试平台)数据同步、时变信道条件下的信号特征提取,以及海量I/Q样本(单组1536个复数点)的实时处理等工程难题。数据集还需持续扩展以涵盖更多新兴信号类型和复杂网络场景,以满足6G时代对频谱智能管理的更高要求。
常用场景
经典使用场景
LibIQ数据集在无线通信领域具有重要的应用价值,特别是在O-RAN架构下的实时频谱分类任务中。该数据集通过收集和分析I/Q样本,为研究人员提供了丰富的信号类型数据,包括LTE、干扰信号、无射频干扰、方波、三角波和雷达信号等。这些数据不仅支持频域和时域的分析,还能通过卷积神经网络(CNN)进行高效分类,为实时频谱监测和信号识别提供了可靠的基础。
衍生相关工作
LibIQ数据集衍生了一系列经典研究工作,特别是在深度学习驱动的频谱分类领域。例如,基于该数据集的CNN模型被用于优化实时信号处理算法,显著提升了分类速度和准确性。此外,LibIQ还被用于开发新的频谱感知技术,如能量峰值检测器和频域特征提取方法。这些工作不仅推动了无线通信技术的发展,还为O-RAN架构的标准化和商业化应用提供了重要参考。
数据集最近研究
最新研究方向
LibIQ数据集作为开放无线接入网络(O-RAN)领域的重要资源,近期研究聚焦于实时频谱分类与智能信号处理技术的融合创新。随着5G/6G网络对动态频谱共享需求的激增,该数据集通过整合深度学习方法与分布式应用(dApps)架构,为无线信号识别提供了高精度的时间序列分析框架。研究热点集中在卷积神经网络(CNN)在边缘计算环境下的优化部署,以及跨异构测试平台(如Colosseum仿真器与空中测试床)的模型泛化能力验证。最新实验表明,基于该数据集构建的分类模型在六类信号识别中达到97.8%的平均准确率,同时满足10毫秒级实时性要求,为O-RAN实现微秒级控制环路提供了关键技术支持。其创新性体现在将能量峰值检测器与频域特征提取相结合,显著提升了复杂电磁环境下的干扰信号辨识效率,对推动认知无线电、频谱共享等前沿应用具有重要价值。
相关研究论文
- 1LibIQ: Toward Real-Time Spectrum Classification in O-RAN dApps意大利罗马第一大学, 美国东北大学无线互联网物联网研究所 · 2025年
以上内容由遇见数据集搜集并总结生成



