The Mask Sorbonne Speech Corpus (MSSC)
收藏github2020-07-31 更新2024-05-31 收录
下载链接:
https://github.com/MaskSorbonneSpeechCorpus/sentences
下载链接
链接失效反馈官方服务:
资源简介:
Mask Sorbonne语音语料库包含2,000个德语录音句子。为了测量口罩材料引起的语音变化,我们使用了一个位于高密度泡沫块中的人工语音发生器。语音发生器是一个微型蓝牙扬声器(Bose Sound Link micro),位于无回声室中。从德语远场语音数据语料库中选取了30位说话者的1,000个句子,并选择了Kinect直接访问录音条件,未使用文本转录。
The Mask Sorbonne Speech Corpus comprises 2,000 recorded German sentences. To measure the speech alterations induced by mask materials, we employed an artificial speech generator embedded within a high-density foam block. The speech generator, a compact Bluetooth speaker (Bose Sound Link micro), was situated in an anechoic chamber. From the German far-field speech data corpus, 1,000 sentences from 30 speakers were selected, and the Kinect direct access recording conditions were chosen, without the use of text transcription.
创建时间:
2020-07-31
原始信息汇总
数据集概述
数据集名称
- Mask Sorbonne Speech Corpus (MSSC)
语言
- 德语
数据量
- 包含2,000条录音句子
录音设置
- 使用人工声音生成器,放置在高密度泡沫块中
- 声音生成器为微型蓝牙扬声器(Bose Sound Link micro),位于无回声室内
录音来源
- 从德国远场语音数据集(German Distant Speech Data Corpu)中选取1,000条句子,由30位说话者发音
录音条件
- 采用Kinect直接访问录音条件
- 未使用文本转录
附加信息
- 选定句子的列表可在此处获取
搜集汇总
数据集介绍

构建方式
The Mask Sorbonne Speech Corpus (MSSC) 数据集的构建过程专注于研究口罩材料对语音吸收的影响。该数据集包含2000条德语录音句子,通过使用高密度泡沫块中的人工语音生成器进行录制。语音生成器采用Bose Sound Link微型蓝牙扬声器,并置于无回声室中以确保录音质量。其中1000条句子选自德国远场语音数据集,由30位不同说话者录制,未使用文本转录。
特点
MSSC数据集的特点在于其专注于语音在口罩材料影响下的变化,提供了高质量的录音数据。数据集中的句子均通过无回声室录制,确保了录音的纯净性。此外,数据集涵盖了30位不同说话者的语音样本,增强了数据的多样性和代表性。这些特点使得MSSC成为研究语音吸收和口罩材料影响的理想选择。
使用方法
MSSC数据集的使用方法主要集中在语音分析和语音吸收研究领域。研究人员可以通过分析数据集中的录音,评估不同口罩材料对语音传播的影响。数据集中的句子列表可供下载,便于用户进行进一步的分析和实验。由于录音条件严格控制在无回声室中,用户可以直接利用这些数据进行语音信号处理、声学建模等研究。
背景与挑战
背景概述
The Mask Sorbonne Speech Corpus (MSSC) 是由索邦大学的研究团队于近年创建的一个德语语音数据集,旨在研究口罩材料对语音吸收的影响。该数据集包含2000条由人工语音生成器在高密度泡沫块中录制的德语句子,语音生成器位于消声室内,以确保录音环境的纯净性。研究团队从德国远场语音数据集中选取了1000条句子,并由30名说话者进行录制。该数据集的创建为语音信号处理领域提供了新的研究方向,特别是在口罩对语音传播的影响方面,具有重要的学术价值和应用前景。
当前挑战
MSSC数据集的研究挑战主要集中在两个方面。首先,语音信号在口罩材料中的吸收效应是一个复杂的物理现象,如何准确量化这种效应并提取有效的语音特征是一个技术难题。其次,数据集的构建过程中,研究团队需要确保录音环境的纯净性,避免外界噪声的干扰,这对实验设备和技术提出了较高要求。此外,由于语音生成器的使用,如何模拟真实人类语音的自然性和多样性也是一个需要克服的挑战。这些挑战不仅推动了语音信号处理技术的发展,也为相关领域的研究提供了新的思路。
常用场景
经典使用场景
The Mask Sorbonne Speech Corpus (MSSC) 数据集主要用于研究口罩对语音传播的影响。通过使用高密度泡沫块中的人工语音生成器,该数据集能够精确模拟口罩材料对声音吸收的效果。这一场景特别适用于语音处理和声学研究领域,帮助研究人员理解在不同声学环境下语音的传播特性。
解决学术问题
MSSC 数据集解决了语音传播中声音吸收效应的量化问题。通过对比有无口罩情况下的语音数据,研究人员能够分析口罩材料对语音清晰度和音质的具体影响。这一研究对于改进语音识别系统、优化通信设备以及开发更有效的声学材料具有重要意义。
衍生相关工作
基于 MSSC 数据集,多项研究已经展开,特别是在语音增强和噪声抑制领域。例如,一些研究利用该数据集开发了新的算法,用于在嘈杂环境中提高语音识别的准确性。此外,该数据集还被用于评估不同口罩材料对语音传播的影响,推动了声学材料科学的发展。
以上内容由遇见数据集搜集并总结生成



