gigant/romanian_speech_synthesis_0_8_1
收藏Hugging Face2022-10-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gigant/romanian_speech_synthesis_0_8_1
下载链接
链接失效反馈官方服务:
资源简介:
罗马尼亚语音合成(RSS)语料库是在爱丁堡大学的半消声室中录制的,使用了三种高质量的工作室麦克风。当前发布的数据仅包括通过Sennheiser MKH 800麦克风录制的语音数据,未来可能会发布通过其他麦克风录制的数据。所有录音的采样频率为96 kHz,每个样本24位,然后下采样到48 kHz。数据集包含3500个训练句子和500个测试句子,由一位女性说话者录制。数据集分为训练集和测试集,分别包含3180和536个音频片段及其对应的句子。
提供机构:
gigant
原始信息汇总
数据集概述
数据集名称
Romanian Speech Synthesis (RSS)
数据集描述
RSS数据集是为语音合成设计的罗马尼亚语语音数据集。该数据集在爱丁堡大学的一个半消声室内录制,使用了三种高质量的录音设备,包括Neumann u89i、Sennheiser MKH 800和DPA 4035。当前版本仅包含通过Sennheiser MKH 800录制的语音数据。所有录音最初以96 kHz采样频率和24位每样本录制,后被下采样至48 kHz。数据集共进行了8次录音会话,每次约500句话。
语言
罗马尼亚语
数据集结构
- 数据实例:每个数据点包括音频文件路径和对应的句子。
- 数据字段:
- audio:包含音频文件路径、解码后的音频数组和采样率。
- sentence:用户被提示说出的句子。
- 数据分割:数据集被分为训练集和测试集。训练集包含3180个音频片段及其相关句子,测试集包含536个音频片段及其相关句子。
引用信息
@article{Stan2011442, title={The {R}omanian speech synthesis ({RSS}) corpus: Building a high quality {HMM}-based speech synthesis system using a high sampling rate}, author={Adriana Stan and Junichi Yamagishi and Simon King and Matthew Aylett}, journal={Speech Communication}, volume={53}, number={3}, pages={442--450}, year={2011}, doi={10.1016/j.specom.2010.12.002} }



