MCM Dataset Generator
收藏github2025-08-04 更新2025-08-05 收录
下载链接:
https://github.com/Creator-willing/MCM_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该仓库包含用于生成多载波调制(MCM)识别数据集的MATLAB脚本。提供了两个主要脚本:`gen_MWR_dataset.m`生成标准MCM数据集,固定QPSK调制;`gen_MWR_dataset_difmod.m`生成增强数据集,包含多种子载波调制方案(QPSK、16QAM、64QAM)。数据集生成过程包括参数初始化、调制器对象创建、数据生成循环和数据保存。
This repository contains MATLAB scripts for generating multi-carrier modulation (MCM) recognition datasets. Two primary scripts are provided: `gen_MWR_dataset.m` generates a standard MCM dataset with fixed QPSK modulation; `gen_MWR_dataset_difmod.m` generates an enhanced dataset that includes multiple subcarrier modulation schemes (QPSK, 16QAM, 64QAM). The dataset generation process includes parameter initialization, modulator object creation, data generation loops, and data saving.
创建时间:
2025-08-04
原始信息汇总
MCM数据集概述
数据集生成器
- 用途:生成多载波调制分类数据集
- 特点:包含全面的参数配置和多种调制方案
主要脚本
gen_MWR_dataset.m- 标准MCM数据集
- 固定QPSK调制
gen_MWR_dataset_difmod.m- 增强数据集
- 多种子载波调制方案(QPSK/16QAM/64QAM)
生成流程
-
参数初始化
- 采样率/SNR范围/蒙特卡洛重复次数
- 信道参数配置
- 调制特定参数定义
-
调制器对象创建
- 创建8种调制器对象
- 初始化快速衰落信道模型
-
数据生成循环
- 三层嵌套循环(调制类型/SNR水平/蒙特卡洛重复)
- 添加信号损伤
- 通过信道模型
-
数据处理
- 数据归一化
- 保存为.mat文件
关键参数对比
| 参数 | 标准数据集 | 增强数据集 |
|---|---|---|
| SNR范围 | -18:2:20 dB | -18:2:20 dB |
| 蒙特卡洛重复 | 2000 | 1800 |
| 子载波调制 | QPSK | QPSK/16QAM/64QAM |
| 调制分布 | 均衡分布 | 每种600样本 |
| 输出文件 | MWR_all_AMC.mat | MWR_all_AMC_diffmod.mat |
系统参数
- 采样率:15e3×256 Hz
- 子载波间隔:15e3 Hz
- 时间步长:1/SamplingRate
信道参数
- 车速:60 km/h
- 功率延迟分布:VehicularA
- 多普勒模型:Jakes
- 载波频率:1e9 Hz
- 频率偏移:0.4(归一化)
调制方案
- AFDM(仿射频分复用)
- GFDM(广义频分复用)
- FOFDM(滤波OFDM)
- UFMC(通用滤波多载波)
- FBMC(滤波器组多载波)
- OTFS(正交时频空间)
- OFDM(正交频分复用)
- WOLA(加窗OFDM)
数据集结构
- 维度:[SNR水平, 蒙特卡洛重复, 2, 1024]
- 通道1:信号实部
- 通道2:信号虚部
- 信号长度:每帧1024样本
- 数据格式:归一化(零均值/单位方差)
损伤模型
- 频率偏移
- 时间偏移
- 相位噪声(未使用)
- 信道(VehicularA+Jakes多普勒)
- AWGN噪声
输出文件
- MWR_all_AMC.mat(标准数据集)
- MWR_all_AMC_diffmod.mat(增强数据集)
数据集划分建议
- 训练集:70%(224,000样本)
- 验证集:10%
- 测试集:20%(64,000样本)
仿真环境
- GPU:NVIDIA GeForce RTX 4070
- 框架:PyTorch 2.4.1
- CUDA版本:12.4
- 操作系统:Windows11
- 编程语言:Python3.12.7
搜集汇总
数据集介绍

构建方式
在多载波调制分类研究领域,MCM数据集通过MATLAB脚本实现了系统化的数据生成流程。该数据集构建采用参数化建模方法,初始化阶段配置了采样率、信噪比范围和蒙特卡洛重复次数等核心参数,并建立了包含FBMC、OFDM等八种调制方案的调制器对象库。数据生成环节采用三重嵌套循环结构,依次遍历调制类型、信噪比等级和蒙特卡洛迭代,通过施加频偏、时偏等信道损伤模型,结合Jakes多普勒信道和加性高斯白噪声,最终生成包含实部与虚部的归一化信号数据。
特点
该数据集最显著的特征在于其完备的多维度参数体系,不仅涵盖20个离散信噪比等级和2000次蒙特卡洛实验,更创新性地通过两个版本脚本实现调制方案的差异化配置:基础版本采用固定QPSK调制,增强版本则整合QPSK、16QAM和64QAM三种子载波调制方式。数据集以四维张量结构组织数据,每帧信号包含1024个采样点,并严格遵循零均值、单位方差的标准化处理,确保数据质量的一致性。特别值得注意的是,其信道模型精确模拟了时速60公里的车载环境,采用VehicularA功率延迟分布,为移动通信场景研究提供了高保真的实验数据。
使用方法
使用该数据集时,研究人员可通过执行MATLAB脚本快速生成标准化数据文件,其中gen_MWR_dataset.m生成基础版本,gen_MWR_dataset_difmod.m则输出多调制版本。生成的数据集建议按7:1:2比例划分训练集、验证集和测试集,基础版本包含8类调制信号共计32万样本,增强版本每种子载波调制配置600个样本。数据以.mat格式存储,包含实虚部双通道信号,可直接导入Python或MATLAB环境,与PyTorch等深度学习框架兼容。实验环境推荐配置NVIDIA显卡以加速模型训练,数据集特别适用于多载波调制识别算法的性能验证与比较研究。
背景与挑战
背景概述
MCM Dataset Generator是为多载波调制识别任务设计的数据集生成工具,由MATLAB脚本实现。该数据集专注于多载波调制技术的分类研究,涵盖了FBMC、OFDM、WOLA等多种调制方案。数据集通过模拟真实通信环境中的各种参数配置和信道条件,为调制识别算法提供了丰富的训练和测试样本。其核心研究问题在于解决复杂信道环境下多载波调制信号的自动分类难题,对无线通信系统的智能感知与优化具有重要意义。
当前挑战
该数据集面临的挑战主要体现在两个方面:在领域问题层面,多载波调制信号在复杂信道条件下的特征提取与分类仍存在较大难度,特别是当信号受到频率偏移、相位噪声等多重干扰时;在构建过程层面,数据集需要精确模拟各种信道条件和调制参数,确保生成数据的真实性和多样性,同时要平衡不同调制类型和信噪比条件下的样本分布,这对参数配置和计算资源都提出了较高要求。
常用场景
经典使用场景
在无线通信领域,多载波调制技术因其高频谱效率和抗多径干扰能力而备受关注。MCM Dataset Generator通过生成包含多种调制方案(如FBMC、OFDM、WOLA等)的标准化数据集,为研究人员提供了一个可靠的基准测试平台。该数据集特别适用于开发与验证多载波调制信号的自动分类算法,其经典使用场景包括信号识别模型的训练与性能评估。通过模拟真实信道环境中的各种损伤(如频率偏移、时间偏移和相位噪声),该数据集能够有效反映实际通信系统中的复杂条件。
解决学术问题
多载波调制信号的自动分类是无线通信研究中的关键问题之一。MCM Dataset Generator通过提供包含多种调制类型和信道损伤的标准化数据,解决了传统研究中数据获取困难且缺乏可比性的问题。该数据集支持对信号分类算法的鲁棒性进行系统评估,尤其是在低信噪比条件下。其意义在于为学术界提供了一个可重复的实验基准,促进了不同研究方法之间的公平比较,并推动了多载波调制识别技术的进步。
衍生相关工作
基于MCM Dataset Generator的丰富数据,研究人员已开展了多项经典工作。其中包括使用卷积神经网络(CNN)和长短期记忆网络(LSTM)进行调制分类的对比研究,以及探索注意力机制在低信噪比条件下的性能提升。该数据集还催生了对多任务学习框架的探索,如同时实现调制分类和信道参数估计。这些工作不仅验证了数据集的实用性,还推动了通信信号处理与深度学习的交叉研究。
以上内容由遇见数据集搜集并总结生成



