WSJ0 Hipster 城市噪音音频数据集 环境主要包括餐馆、咖啡馆、酒吧和公园
收藏帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-26609.html
下载链接
链接失效反馈官方服务:
资源简介:
WSJ0 Hipster环境混合(WHAM!)数据集将WSJ0-2mix数据集中的每两种扬声器混合与独特的噪声背景场景配对。我们还创建了WHAMR!,除了背景噪声之外,将人工混响添加到语音信号的扩展。 2018年末,在旧金山湾区的各个城市地点收集了噪音音频。环境主要包括餐馆、咖啡馆、酒吧和公园。音频是使用Apogee Sennheiser双耳麦克风在距离地面1.0至1.5米的三脚架上录制的。 这里提供了一组噪声样本,称为“WHAM!噪声数据集”,以及构建WHAM!还有WHAMR!来自噪声数据和WSJ0数据集的数据集。我们还提供了“WHAM!48kHz噪声数据集”,由原始采样率的噪声记录组成,而不将剪辑分割到WSJ0剪辑的持续时间。两个WHAM!噪声数据集和WHAM!48kHz噪声数据集已被处理以去除包含可理解语音的任何片段。因为WHAM!48kHz噪声数据集尚未进一步分割到WSJ0剪辑的持续时间,它具有广泛的剪辑持续时间分布。 The WHAM! noise dataset is split into training, validation, and test sets following the wsj0-2mix dataset. The clips are in 32-bit floating point WAV format with 2 channels and a sampling rate of 16 kHz. The average clip duration is 10 seconds with the shortest clip being 3.5 seconds and the longest 47.7 seconds. WHAM! is a joint effort between Mitsubishi Electronics Research Laboratories (MERL) and Whisper. If you use WHAM! or WHAM!48kHz please cite our paper describing the dataset: If you use WHAMR! please citeour paper describing the dataset:
提供机构:
帕依提提



