SP2-Speech-Corpus

github2017-03-29 更新2024-05-31 收录

下载链接：

https://github.com/SP2-Consortium/SP2-Speech-Corpus

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个多语言语音语料库，包含用于研究跨语言韵律转换的韵律丰富的句子，适用于表现性语音合成领域。该语料库是在瑞士国家科学基金会支持的“SP2: SCOPES语音韵律项目”研究项目中创建的。

This is a multilingual speech corpus containing prosody-rich sentences for the study of cross-linguistic prosody transfer, suitable for the field of expressive speech synthesis. The corpus was developed under the research project 'SP2: SCOPES Speech Prosody Project', supported by the Swiss National Science Foundation.

创建时间：

2016-06-01

原始信息汇总

SP2-Speech-Corpus

概述

SP2-Speech-Corpus是一个多语言语音语料库，专为跨语言韵律转换研究设计，特别是在表现性语音合成领域。该语料库由瑞士国家科学基金会支持的“SP2: SCOPES项目关于语音韵律”研究项目创建。

内容

语料库包含50对句子的录音，每对包括一个预设强调的句子和一个无强调的句子。这些句子根据强调类型分为五组：

A. 单字强调
B. 句子早期强调
C. 对比强调
D. 疑问句中的对比强调
E. 由于语义焦点导致的相对较大的成分强调

初始提交包含来自8位不同语言（英语、法语、德语、匈牙利语、塞尔维亚语和马其顿语）的演讲者的录音。

引用

语料库的相关研究发表于： Sečujski, Milan, et al., "Design of a Speech Corpus for Research on Cross-Lingual Prosody Transfer." In International Conference on Speech and Computer, pp. 199-206. Springer International Publishing, 2016.

许可证

所有音频录音均根据[Creative Commons Attribution-ShareAlike 4.0 International License]授权。

搜集汇总

数据集介绍

构建方式

SP2-Speech-Corpus数据集是在瑞士国家科学基金会支持的SP2：SCOPES语音韵律研究项目框架下创建的多语种语音库。该数据集包含50对句子的录音，每对句子中一个具有预定的强调，另一个没有。这些句子根据强调的类型分为五组，涵盖从单词重音到语义焦点的不同情境。初始提交中包含了8位演讲者在6种语言（英语、法语、德语、匈牙利语、塞尔维亚语和马其顿语）中的录音。

特点

本数据集的特点在于其多语种性质和对跨语种韵律转移研究的针对性设计。通过精心挑选的句子对，以及根据强调类型进行的分类，为表达性语音合成领域中的韵律研究提供了丰富的素材。此外，数据集采用Creative Commons Attribution-ShareAlike 4.0国际许可，鼓励学术共享与合作。

使用方法

使用SP2-Speech-Corpus数据集，研究者可以探索不同语言间的韵律转移现象。数据集的开放性许可使得研究者能够自由使用和分享这些音频记录，以便进行跨语种语音合成的相关研究。用户需要遵守相应的许可协议，并在使用时引用相关参考文献，以确保合法合规地利用数据集资源。

背景与挑战

背景概述

SP2-Speech-Corpus是一个为研究跨语调语音合成中的跨语调转移而设计的多语种语音库。该语音库的创建是在瑞士国家科学基金会支持的'SP2: SCOPES语音韵律研究项目'框架内进行的。该库包含有预定强调的句子和无强调的句子各50对的录音，旨在为跨语调韵律转移领域的研究提供丰富语调的句子材料。初始提交中包含了8位演讲者在6种语言（英语、法语、德语、匈牙利语、塞尔维亚语和马其顿语）中的录音。

当前挑战

该数据集在构建过程中遇到的挑战主要包括：多语种语音的采集与标注，特别是在跨语调韵律转移的研究背景下，如何确保不同语言间的语调特征具有一致性和可比性。此外，挑战还体现在如何精确地划分和标识不同类型的强调，以便于后续的语音合成和韵律建模研究。在研究领域问题上，SP2-Speech-Corpus面临的挑战是如何有效地促进语音合成系统中韵律的自然度和表现力的提升，尤其是在非母语语境中保持语音的自然度。

常用场景

经典使用场景

在语音合成领域，尤其是跨语言音调转移的研究中，SP2-Speech-Corpus数据集显得尤为重要。该数据集包含预定了强调的句子录音，旨在用于表达性语音合成的研究。其经典使用场景在于，研究者可以通过分析不同语言中强调的位置和类型，探究如何将一种语言的音调特征转移到另一种语言上，从而实现更加自然的多语言语音合成。

实际应用

在实际应用中，SP2-Speech-Corpus数据集可用于开发和优化多语言语音合成系统，为语音助手、语音转文本等应用提供更加自然和准确的语音输出。此外，它还可以用于语言教学，帮助学习者更好地理解不同语言中的音调模式和强调习惯。

衍生相关工作

基于SP2-Speech-Corpus数据集，已经衍生出一系列相关研究工作，包括音调转移算法的开发、跨语言语音合成模型的构建以及语音识别中的音调特征分析等。这些工作不仅扩展了该数据集的应用范围，也为相关领域的研究提供了重要的数据支持和启示。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集