The Mask Sorbonne Speech Corpus (MSSC)

github2020-07-31 更新2024-05-31 收录

下载链接：

https://github.com/MaskSorbonneSpeechCorpus/sentences

下载链接

链接失效反馈

官方服务：

资源简介：

Mask Sorbonne语音语料库包含2,000个德语录音句子。为了测量口罩材料引起的语音变化，我们使用了一个位于高密度泡沫块中的人工语音发生器。语音发生器是一个微型蓝牙扬声器（Bose Sound Link micro），位于无回声室中。从德语远场语音数据语料库中选取了30位说话者的1,000个句子，并选择了Kinect直接访问录音条件，未使用文本转录。

The Mask Sorbonne Speech Corpus comprises 2,000 recorded German sentences. To measure the speech alterations induced by mask materials, we employed an artificial speech generator embedded within a high-density foam block. The speech generator, a compact Bluetooth speaker (Bose Sound Link micro), was situated in an anechoic chamber. From the German far-field speech data corpus, 1,000 sentences from 30 speakers were selected, and the Kinect direct access recording conditions were chosen, without the use of text transcription.

创建时间：

2020-07-31

原始信息汇总

数据集概述

数据集名称

Mask Sorbonne Speech Corpus (MSSC)

语言

德语

数据量

包含2,000条录音句子

录音设置

使用人工声音生成器，放置在高密度泡沫块中
声音生成器为微型蓝牙扬声器（Bose Sound Link micro），位于无回声室内

录音来源

从德国远场语音数据集（German Distant Speech Data Corpu）中选取1,000条句子，由30位说话者发音

录音条件

采用Kinect直接访问录音条件
未使用文本转录

附加信息

选定句子的列表可在此处获取

搜集汇总

数据集介绍

构建方式

The Mask Sorbonne Speech Corpus (MSSC) 数据集的构建过程专注于研究口罩材料对语音吸收的影响。该数据集包含2000条德语录音句子，通过使用高密度泡沫块中的人工语音生成器进行录制。语音生成器采用Bose Sound Link微型蓝牙扬声器，并置于无回声室中以确保录音质量。其中1000条句子选自德国远场语音数据集，由30位不同说话者录制，未使用文本转录。

特点

MSSC数据集的特点在于其专注于语音在口罩材料影响下的变化，提供了高质量的录音数据。数据集中的句子均通过无回声室录制，确保了录音的纯净性。此外，数据集涵盖了30位不同说话者的语音样本，增强了数据的多样性和代表性。这些特点使得MSSC成为研究语音吸收和口罩材料影响的理想选择。

使用方法

MSSC数据集的使用方法主要集中在语音分析和语音吸收研究领域。研究人员可以通过分析数据集中的录音，评估不同口罩材料对语音传播的影响。数据集中的句子列表可供下载，便于用户进行进一步的分析和实验。由于录音条件严格控制在无回声室中，用户可以直接利用这些数据进行语音信号处理、声学建模等研究。

背景与挑战

背景概述

The Mask Sorbonne Speech Corpus (MSSC) 是由索邦大学的研究团队于近年创建的一个德语语音数据集，旨在研究口罩材料对语音吸收的影响。该数据集包含2000条由人工语音生成器在高密度泡沫块中录制的德语句子，语音生成器位于消声室内，以确保录音环境的纯净性。研究团队从德国远场语音数据集中选取了1000条句子，并由30名说话者进行录制。该数据集的创建为语音信号处理领域提供了新的研究方向，特别是在口罩对语音传播的影响方面，具有重要的学术价值和应用前景。

当前挑战

MSSC数据集的研究挑战主要集中在两个方面。首先，语音信号在口罩材料中的吸收效应是一个复杂的物理现象，如何准确量化这种效应并提取有效的语音特征是一个技术难题。其次，数据集的构建过程中，研究团队需要确保录音环境的纯净性，避免外界噪声的干扰，这对实验设备和技术提出了较高要求。此外，由于语音生成器的使用，如何模拟真实人类语音的自然性和多样性也是一个需要克服的挑战。这些挑战不仅推动了语音信号处理技术的发展，也为相关领域的研究提供了新的思路。

常用场景

经典使用场景

The Mask Sorbonne Speech Corpus (MSSC) 数据集主要用于研究口罩对语音传播的影响。通过使用高密度泡沫块中的人工语音生成器，该数据集能够精确模拟口罩材料对声音吸收的效果。这一场景特别适用于语音处理和声学研究领域，帮助研究人员理解在不同声学环境下语音的传播特性。

解决学术问题

MSSC 数据集解决了语音传播中声音吸收效应的量化问题。通过对比有无口罩情况下的语音数据，研究人员能够分析口罩材料对语音清晰度和音质的具体影响。这一研究对于改进语音识别系统、优化通信设备以及开发更有效的声学材料具有重要意义。

衍生相关工作

基于 MSSC 数据集，多项研究已经展开，特别是在语音增强和噪声抑制领域。例如，一些研究利用该数据集开发了新的算法，用于在嘈杂环境中提高语音识别的准确性。此外，该数据集还被用于评估不同口罩材料对语音传播的影响，推动了声学材料科学的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集