rf-spectral-trajectories
收藏Hugging Face2026-03-28 更新2026-03-29 收录
下载链接:
https://huggingface.co/datasets/OzLabs/rf-spectral-trajectories
下载链接
链接失效反馈官方服务:
资源简介:
RF Spectral Trajectories 是一个包含模拟宽带通信环境中射频(RF)频谱图时间序列的数据集。每条轨迹是由连续RF场景中16个连续的短时傅里叶变换(STFT)观测组成的滑动窗口,捕捉了多个信号随时间出现、消失、频率漂移和功率变化的过程。数据集分为训练集(13,841条轨迹,10 GB)、验证集(2,938条轨迹,1.1 GB)和测试集(2,999条轨迹,1.2 GB),存储为HDF5格式。每条轨迹包含观测张量(形状为[16, 256, 51, 2],表示16个时间步、256个频率箱、51个时间箱和实虚两部分)、时间戳、场景标识符和唯一轨迹标识符。数据集按场景划分以防止时间泄漏,训练、验证和测试集分别包含280、60和60个场景。信号模拟参数包括150 kHz的采样率、80 ms的时间步长、5.2秒的场景时长、2-4个随机频率位置的信号、-8至+30 dB的信噪比范围等。STFT参数包括256个样本的汉明窗、16个样本的重叠和256点的FFT大小。数据集还模拟了8种活动模式(如安静、密集、突发等)和动态特征(如频率漂移、功率变化和信道衰落)。数据集使用ChangShuoRadioData (CSRD) MATLAB仿真框架生成,适用于时间序列预测、信号处理和无线通信等任务。
创建时间:
2026-03-27
原始信息汇总
RF Spectral Trajectories 数据集概述
数据集基本信息
- 数据集名称:RF Spectral Trajectories
- 发布者:Ozlabs
- 许可证:MIT
- 任务类别:时间序列预测
- 数据规模:10K < n < 100K
- 标签:radio-frequency, spectrogram, signal-processing, simulation, trajectory, stft, iq-data, wireless-communication
数据集内容与结构
该数据集包含来自模拟宽带通信环境的射频(RF)频谱图的时间有序序列。每条轨迹是从连续RF场景中截取的16个连续短时傅里叶变换(STFT)观测值的滑动窗口,捕获了多个信号如何随时间出现、消失、频率漂移和功率变化。
文件与划分
数据集包含三个划分,文件格式为HDF5(.h5)。
| 文件 | 划分 | 轨迹数量 | 文件大小 |
|---|---|---|---|
train.h5 |
训练集 | 13,841 | 10 GB |
val.h5 |
验证集 | 2,938 | 1.1 GB |
test.h5 |
测试集 | 2,999 | 1.2 GB |
数据模式(HDF5 Schema)
每个HDF5文件包含以下键:
| 键 | 形状 | 数据类型 | 描述 |
|---|---|---|---|
observations |
[N, 16, 256, 51, 2] |
float16 | STFT幅度(实部和虚部通道) |
timestamps |
[N, 16] |
float64 | 每个时间步的时间(秒) |
source_ids |
[N] |
string | 场景标识符(用于溯源) |
sequence_ids |
[N] |
string | 唯一轨迹标识符 |
观测张量维度说明:
N:轨迹数量16:每条轨迹的时间步数(每步80毫秒,总计1.28秒)256:频率仓数(STFT,覆盖±75 kHz)51:每个80毫秒STFT窗口内的时间仓数2:实部和虚部分量
划分策略
为避免重叠滑动窗口导致的时间泄漏,按源场景(而非轨迹)进行划分。
| 划分 | 场景数量 | 比例 |
|---|---|---|
| 训练集 | 280 | 70% |
| 验证集 | 60 | 15% |
| 测试集 | 60 | 15% |
数据生成参数
信号模拟参数
| 参数 | 值 |
|---|---|
| 采样率 | 150 kHz |
| 时间步长 | 80 毫秒(12,000个样本) |
| 场景时长 | 5.2 秒(65个时间步) |
| 轨迹长度 | 16个时间步(1.28 秒) |
| 滑动窗口步长 | 1个时间步 |
| 调制类型 | BPSK, QPSK, 8PSK, 16QAM, 64QAM |
| 每个场景的信号数量 | 2–4个(随机频率位置) |
| 信道模型 | Rayleigh, Rician(具有演变的衰落) |
| 信噪比范围 | -8 到 +30 dB |
| 多普勒速度 | 0–12 m/s |
STFT参数
| 参数 | 值 |
|---|---|
| 窗口 | Hamming,256个样本 |
| 重叠 | 16个样本 |
| FFT大小 | 256 |
| 边带 | 双边带(复数输入) |
活动模式
每个场景遵循8种活动模式之一(每种模式50个场景,共400个场景):
| 模式 | 描述 |
|---|---|
quiet |
活动信号少,占空比低,静默期长 |
dense |
多个信号同时活动,高度重叠 |
bursty |
快速开/关转换,短脉冲串 |
ramp_up |
信号在场景中逐渐出现 |
interference_event |
稳定信号,然后在场景中期出现干扰信号 |
correlated_alternating |
信号对交替:A开时B关 |
correlated_leader_follower |
信号B在信号A出现后1–3个时间步出现 |
random |
独立的随机脉冲串模式 |
动态特征
- 频率漂移:信号频率缓慢漂移(随机游走,限制在信号带宽的±50%以内)
- 功率变化:平滑的每时间步功率水平(活动时为0.3–1.0),逐渐淡入/淡出,相关的功率漂移
- 信道衰落:Rayleigh/Rician衰落每个场景内连续演变(时间步之间状态不重置)
数据来源与引用
-
生成工具:使用 ChangShuoRadioData (CSRD) MATLAB模拟框架及LeWM数据集流水线生成。
-
引用格式: bibtex @software{csrd_rf_spectral_trajectories_2026, title = {RF Spectral Trajectories}, author = {Ozlabs}, year = {2026}, url = {https://huggingface.co/datasets/ozlabs/rf-spectral-trajectories} }
-
相关资源:
- ChangShuoRadioData — MATLAB RF模拟框架
- Joint Signal Detection and AMC via Deep Learning — 使用CSRD数据的IEEE TWC论文
搜集汇总
数据集介绍

构建方式
在无线通信领域,对射频信号的动态特性进行建模是理解复杂电磁环境的关键。RF Spectral Trajectories数据集通过ChangShuoRadioData MATLAB仿真框架系统构建,模拟了宽带通信场景。其核心是生成长度为5.2秒的连续射频场景,并从中以单步长滑动窗口截取16个连续的短时傅里叶变换观测序列,形成每条轨迹,总计覆盖1.28秒的时序演变。仿真参数精心设计,采样率为150 kHz,每条轨迹的时间步长为80毫秒。信号模拟涵盖了多种调制类型、瑞利与莱斯信道模型,并引入了频率漂移、功率平滑变化以及连续演变的信道衰落等动态特征,确保了数据的高度逼真性与时序连续性。
特点
该数据集在射频信号处理领域呈现出显著的结构化与多元化特征。每条数据轨迹是一个五维张量,精确记录了16个连续时间步上256个频率通道与51个时间仓的复数值频谱。数据集严格按仿真场景而非轨迹进行划分,有效避免了因滑动窗口重叠可能导致的时间信息泄露,保障了模型评估的严谨性。其核心价值在于模拟了八种不同的信号活动模式,从稀疏静默到密集重叠,从突发传输到具有相关性的交替出现,为算法提供了检验其在多样化、非平稳电磁环境下泛化能力的基准。丰富的元数据,如信噪比、活动模式标识与场景来源,为深度分析提供了有力支撑。
使用方法
为便于研究社区使用,该数据集提供了多种灵活的加载方式。用户可通过HuggingFace的`datasets`库直接加载,获取包含元数据的结构化访问,观测张量以二进制格式存储,需使用NumPy进行解码重塑。对于需要高性能或自定义数据管道的场景,可直接利用h5py库读取原始的HDF5文件,获取完整的张量与时间戳数组。此外,专为PyTorch设计的`LeWMDataset`封装类能够自动将数据转换为张量格式,并集成到深度学习训练流程中。数据集适用于时间序列预测、信号检测、调制识别等任务,其丰富的动态特性为开发与评估能够理解射频场景时序演变的机器学习模型提供了理想平台。
背景与挑战
背景概述
在无线通信领域,对动态射频环境的精确建模与理解是提升频谱感知与信号处理能力的关键。RF Spectral Trajectories数据集由Ozlabs团队于2026年创建,依托ChangShuoRadioData仿真框架生成,旨在为时间序列预测与信号处理研究提供高质量的模拟数据。该数据集的核心研究问题聚焦于宽频带通信场景中多信号行为的时序演化,通过捕获信号在频域和功率上的动态变化,如频率漂移、功率波动及信道衰落,为深度学习模型在复杂电磁环境下的鲁棒性评估与算法创新提供了重要基准。其结构化设计不仅支持射频谱图序列的端到端分析,也对推动自适应调制识别、频谱监测及智能通信系统的发展产生了深远影响。
当前挑战
该数据集致力于解决无线通信中动态频谱场景下的信号检测与行为预测挑战,其核心问题在于如何从高维、噪声干扰的时序谱图中准确识别并跟踪多个信号的演化模式。构建过程中的挑战主要体现在仿真环境的真实性保障与数据结构的复杂性管理:一方面,需在模拟中精确复现多种调制类型、信道模型及活动模式,以覆盖从静态到突发性的多样化场景;另一方面,数据以高分辨率STFT观测序列形式存储,涉及大规模张量处理与时空对齐,同时需通过按场景划分的策略避免滑动窗口带来的时序泄漏,确保评估的严谨性。
常用场景
经典使用场景
在无线通信领域,频谱动态监测是理解复杂电磁环境的核心任务。RF Spectral Trajectories数据集通过模拟宽带通信场景中射频信号的时变特性,为研究者提供了连续的短时傅里叶变换序列。这些序列捕捉了多信号在频率上的漂移、功率的起伏以及信号的出现与消失过程,成为训练和评估时序预测模型的理想基准。该数据集尤其适用于开发深度学习模型,以分析频谱占用模式的演化规律,从而实现对动态频谱环境的精准建模。
实际应用
在实际的射频系统设计与运维中,动态频谱管理是提升频谱利用效率的关键。该数据集模拟了从安静到密集、突发到相关等多种活动模式,能够为认知无线电和动态频谱接入系统提供训练数据。例如,可用于开发智能频谱感知算法,以实时检测并识别未知信号,优化频谱资源分配。此外,在电子战和频谱监测领域,该数据集有助于构建鲁棒的信号识别系统,以应对日益复杂的电磁对抗环境,保障通信安全与可靠性。
衍生相关工作
基于该数据集衍生的经典工作主要集中在深度学习与射频信号处理的交叉领域。例如,相关研究利用其时序特性开发了基于循环神经网络或Transformer的架构,用于联合信号检测与自动调制分类,相关成果已发表在IEEE Transactions on Wireless Communications等顶级期刊。此外,该数据集也催生了针对频谱轨迹预测、异常干扰检测以及多信号分离的创新方法,这些工作不仅验证了数据集的实用性,也为构建下一代智能无线通信系统奠定了算法基础。
以上内容由遇见数据集搜集并总结生成



