five

SFR-mini

收藏
Hugging Face2025-08-27 更新2025-08-28 收录
下载链接:
https://huggingface.co/datasets/MrSheep0765/SFR-mini
下载链接
链接失效反馈
官方服务:
资源简介:
SFR-mini是一个包含经过分段的10秒FM接收音频片段以及帧级别的RSSI轨迹的精选子数据集。该数据集旨在用于混合数字-模拟通信、信道感知音频恢复、语音增强和FM信道建模的研究。它包含了多种类型的内容(新闻、音乐、语音、男声和女声),并在不同的信道质量条件下进行测试。
创建时间:
2025-08-26
原始信息汇总

SFR-mini: FM Reception Speech Dataset (Mini Version) 数据集概述

数据集简介

SFR-mini 是完整 SFR 数据集的精选子集,包含分割的 10 秒 FM 接收音频片段以及帧级 RSSI(接收信号强度指示器)轨迹。该数据集专为混合数字-模拟通信、信道感知音频恢复、语音增强和 FM 信道建模研究而设计。

音频参数

  • 采样率:24 kHz
  • 位深度:16-bit PCM
  • 通道:单声道

数据集统计

  • 总时长:约 10.5 小时
  • 总大小:约 6.6 GB(压缩后)
  • 片段数量:7,405
  • 片段长度:10 秒(固定)

RSSI 参数

  • 采集方式:使用仅用于 RSSI 采集的探测信号,不属于音频部分
  • 原始间隔:约 60 毫秒每次测量(带时间戳)
  • 重采样:插值至 50 毫秒每步,每个 10 秒片段产生 200 个 RSSI 值
  • 原始范围:约 –65 dBm 至 –105 dBm
  • 归一化:线性映射到 [4, 20] 范围,较高值表示较差的信道质量
  • 对齐方式:RSSI 序列与每个音频片段帧对齐

内容特性

包含多种内容类型(新闻、音乐、语音、男声和女声),涵盖不同信道质量条件。

许可信息

采用 CC-BY-NC 4.0 许可协议发布。

引用信息

引用信息将在发布时提供。

搜集汇总
数据集介绍
main_image_url
构建方式
在无线通信研究领域,高质量的音频数据集对于模拟真实信道条件至关重要。SFR-mini数据集通过专业FM接收设备采集原始音频信号,并同步记录接收信号强度指示(RSSI)轨迹。采用固定10秒时长的音频分段策略,每个片段均配有时序对齐的RSSI测量序列,原始测量间隔约60毫秒,经过插值处理统一为50毫秒采样步长,确保每段音频对应200个标准化RSSI数值。数据内容涵盖新闻、音乐、语音等多种音频类型,兼顾不同性别声源和信道质量变化情境。
特点
该数据集的核心特征体现在其多模态数据结构设计上。音频数据采用24kHz采样率和16位PCM编码的单声道格式,确保高保真度与处理一致性。RSSI数据经过线性归一化处理,映射至[4,20]数值区间,其中较高数值对应较差信道条件,这种设计显著增强了信道质量表征的直观性。数据集总量约10.5小时音频,包含7405个严格对齐的音频-RSSI数据对,为研究信道感知音频恢复提供了精准的时空对齐基础。
使用方法
研究者可借助该数据集开展混合数模通信系统的性能验证,特别适用于信道条件与音频质量关联性分析。使用时需注意音频片段与RSSI序列的帧级对齐特性,可直接提取归一化RSSI序列作为信道状态特征输入神经网络。由于未预设训练验证划分,建议采用交叉验证或自定义分割策略评估模型性能。典型应用场景包括FM信道建模、鲁棒性语音增强算法开发,以及信号强度波动下的音频重建研究。
背景与挑战
背景概述
在无线通信与语音处理交叉领域,SFR-mini数据集由研究团队于近年构建,专注于调频接收场景下的语音信号分析。该数据集通过采集实际FM接收环境中的音频信号与接收信号强度指示(RSSI)轨迹,旨在推动混合数字-模拟通信、信道感知音频恢复及语音增强等研究方向的发展。其设计融合多类型内容与多样化信道条件,为信道建模与鲁棒性语音处理提供了关键数据支撑。
当前挑战
SFR-mini致力于解决FM接收环境下语音质量受信道波动影响的核心问题,其挑战在于如何从时变信道中恢复高质量音频,并建立RSSI与语音退化之间的关联模型。构建过程中需克服多源信号同步采集、RSSI与音频帧级对齐,以及在不同信道质量下保持数据一致性与可解释性等难题。
常用场景
经典使用场景
在无线通信系统研究中,SFR-mini数据集为混合数字模拟通信协议开发提供了关键实验数据。研究者利用其对齐的音频信号与RSSI强度序列,构建信道质量与语音传输效果的关联模型,特别适用于模拟FM广播环境下信号衰减对语音清晰度影响的量化分析。该数据集通过包含新闻、音乐、男女声等多种内容类型,确保了信道适应性测试的全面性。
实际应用
实际应用中,该数据集为智能通信设备制造商提供了信道自适应算法的测试平台。工程师可依据RSSI指标动态调整音频编解码参数,显著提升车载FM接收系统、应急通信设备在弱信号环境下的语音可懂度。其多场景音频样本还能支持广播系统优化,实现基于实时信道状态的智能带宽分配。
衍生相关工作
基于该数据集衍生的经典工作包括端到端的神经信道解码架构,其中联合利用RSSI序列与受损音频进行信号重建的方法尤为突出。部分研究团队开发了基于注意力机制的双流网络,实现了信道状态信息与音频特征的深度融合,相关成果已延伸至5G广播系统的自适应调制研究领域。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作