SFR-mini

Hugging Face2025-08-27 更新2025-08-28 收录

下载链接：

https://huggingface.co/datasets/MrSheep0765/SFR-mini

下载链接

链接失效反馈

官方服务：

资源简介：

SFR-mini是一个包含经过分段的10秒FM接收音频片段以及帧级别的RSSI轨迹的精选子数据集。该数据集旨在用于混合数字-模拟通信、信道感知音频恢复、语音增强和FM信道建模的研究。它包含了多种类型的内容（新闻、音乐、语音、男声和女声），并在不同的信道质量条件下进行测试。

创建时间：

2025-08-26

原始信息汇总

SFR-mini: FM Reception Speech Dataset (Mini Version) 数据集概述

数据集简介

SFR-mini 是完整 SFR 数据集的精选子集，包含分割的 10 秒 FM 接收音频片段以及帧级 RSSI（接收信号强度指示器）轨迹。该数据集专为混合数字-模拟通信、信道感知音频恢复、语音增强和 FM 信道建模研究而设计。

音频参数

采样率：24 kHz
位深度：16-bit PCM
通道：单声道

数据集统计

总时长：约 10.5 小时
总大小：约 6.6 GB（压缩后）
片段数量：7,405
片段长度：10 秒（固定）

RSSI 参数

采集方式：使用仅用于 RSSI 采集的探测信号，不属于音频部分
原始间隔：约 60 毫秒每次测量（带时间戳）
重采样：插值至 50 毫秒每步，每个 10 秒片段产生 200 个 RSSI 值
原始范围：约 –65 dBm 至 –105 dBm
归一化：线性映射到 [4, 20] 范围，较高值表示较差的信道质量
对齐方式：RSSI 序列与每个音频片段帧对齐

内容特性

包含多种内容类型（新闻、音乐、语音、男声和女声），涵盖不同信道质量条件。

许可信息

采用 CC-BY-NC 4.0 许可协议发布。

引用信息

引用信息将在发布时提供。

搜集汇总

数据集介绍

构建方式

在无线通信研究领域，高质量的音频数据集对于模拟真实信道条件至关重要。SFR-mini数据集通过专业FM接收设备采集原始音频信号，并同步记录接收信号强度指示（RSSI）轨迹。采用固定10秒时长的音频分段策略，每个片段均配有时序对齐的RSSI测量序列，原始测量间隔约60毫秒，经过插值处理统一为50毫秒采样步长，确保每段音频对应200个标准化RSSI数值。数据内容涵盖新闻、音乐、语音等多种音频类型，兼顾不同性别声源和信道质量变化情境。

特点

该数据集的核心特征体现在其多模态数据结构设计上。音频数据采用24kHz采样率和16位PCM编码的单声道格式，确保高保真度与处理一致性。RSSI数据经过线性归一化处理，映射至[4,20]数值区间，其中较高数值对应较差信道条件，这种设计显著增强了信道质量表征的直观性。数据集总量约10.5小时音频，包含7405个严格对齐的音频-RSSI数据对，为研究信道感知音频恢复提供了精准的时空对齐基础。

使用方法

研究者可借助该数据集开展混合数模通信系统的性能验证，特别适用于信道条件与音频质量关联性分析。使用时需注意音频片段与RSSI序列的帧级对齐特性，可直接提取归一化RSSI序列作为信道状态特征输入神经网络。由于未预设训练验证划分，建议采用交叉验证或自定义分割策略评估模型性能。典型应用场景包括FM信道建模、鲁棒性语音增强算法开发，以及信号强度波动下的音频重建研究。

背景与挑战

背景概述

在无线通信与语音处理交叉领域，SFR-mini数据集由研究团队于近年构建，专注于调频接收场景下的语音信号分析。该数据集通过采集实际FM接收环境中的音频信号与接收信号强度指示（RSSI）轨迹，旨在推动混合数字-模拟通信、信道感知音频恢复及语音增强等研究方向的发展。其设计融合多类型内容与多样化信道条件，为信道建模与鲁棒性语音处理提供了关键数据支撑。

当前挑战

SFR-mini致力于解决FM接收环境下语音质量受信道波动影响的核心问题，其挑战在于如何从时变信道中恢复高质量音频，并建立RSSI与语音退化之间的关联模型。构建过程中需克服多源信号同步采集、RSSI与音频帧级对齐，以及在不同信道质量下保持数据一致性与可解释性等难题。

常用场景

经典使用场景

在无线通信系统研究中，SFR-mini数据集为混合数字模拟通信协议开发提供了关键实验数据。研究者利用其对齐的音频信号与RSSI强度序列，构建信道质量与语音传输效果的关联模型，特别适用于模拟FM广播环境下信号衰减对语音清晰度影响的量化分析。该数据集通过包含新闻、音乐、男女声等多种内容类型，确保了信道适应性测试的全面性。

实际应用

实际应用中，该数据集为智能通信设备制造商提供了信道自适应算法的测试平台。工程师可依据RSSI指标动态调整音频编解码参数，显著提升车载FM接收系统、应急通信设备在弱信号环境下的语音可懂度。其多场景音频样本还能支持广播系统优化，实现基于实时信道状态的智能带宽分配。

衍生相关工作

基于该数据集衍生的经典工作包括端到端的神经信道解码架构，其中联合利用RSSI序列与受损音频进行信号重建的方法尤为突出。部分研究团队开发了基于注意力机制的双流网络，实现了信道状态信息与音频特征的深度融合，相关成果已延伸至5G广播系统的自适应调制研究领域。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集