gigant/romanian_speech_synthesis_0_8_1

Name: gigant/romanian_speech_synthesis_0_8_1
Creator: gigant
Published: 2022-10-24 17:38:35
License: 暂无描述

Hugging Face2022-10-24 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/gigant/romanian_speech_synthesis_0_8_1

下载链接

链接失效反馈

官方服务：

资源简介：

罗马尼亚语音合成（RSS）语料库是在爱丁堡大学的半消声室中录制的，使用了三种高质量的工作室麦克风。当前发布的数据仅包括通过Sennheiser MKH 800麦克风录制的语音数据，未来可能会发布通过其他麦克风录制的数据。所有录音的采样频率为96 kHz，每个样本24位，然后下采样到48 kHz。数据集包含3500个训练句子和500个测试句子，由一位女性说话者录制。数据集分为训练集和测试集，分别包含3180和536个音频片段及其对应的句子。

提供机构：

gigant

原始信息汇总

数据集概述

数据集名称

Romanian Speech Synthesis (RSS)

数据集描述

RSS数据集是为语音合成设计的罗马尼亚语语音数据集。该数据集在爱丁堡大学的一个半消声室内录制，使用了三种高质量的录音设备，包括Neumann u89i、Sennheiser MKH 800和DPA 4035。当前版本仅包含通过Sennheiser MKH 800录制的语音数据。所有录音最初以96 kHz采样频率和24位每样本录制，后被下采样至48 kHz。数据集共进行了8次录音会话，每次约500句话。

语言

罗马尼亚语

数据集结构

数据实例：每个数据点包括音频文件路径和对应的句子。
数据字段：
- audio：包含音频文件路径、解码后的音频数组和采样率。
- sentence：用户被提示说出的句子。
数据分割：数据集被分为训练集和测试集。训练集包含3180个音频片段及其相关句子，测试集包含536个音频片段及其相关句子。

引用信息

@article{Stan2011442, title={The {R}omanian speech synthesis ({RSS}) corpus: Building a high quality {HMM}-based speech synthesis system using a high sampling rate}, author={Adriana Stan and Junichi Yamagishi and Simon King and Matthew Aylett}, journal={Speech Communication}, volume={53}, number={3}, pages={442--450}, year={2011}, doi={10.1016/j.specom.2010.12.002} }

5,000+

优质数据集

54 个

任务类型

进入经典数据集