five

gigant/romanian_speech_synthesis_0_8_1

收藏
Hugging Face2022-10-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gigant/romanian_speech_synthesis_0_8_1
下载链接
链接失效反馈
官方服务:
资源简介:
罗马尼亚语音合成(RSS)语料库是在爱丁堡大学的半消声室中录制的,使用了三种高质量的工作室麦克风。当前发布的数据仅包括通过Sennheiser MKH 800麦克风录制的语音数据,未来可能会发布通过其他麦克风录制的数据。所有录音的采样频率为96 kHz,每个样本24位,然后下采样到48 kHz。数据集包含3500个训练句子和500个测试句子,由一位女性说话者录制。数据集分为训练集和测试集,分别包含3180和536个音频片段及其对应的句子。
提供机构:
gigant
原始信息汇总

数据集概述

数据集名称

Romanian Speech Synthesis (RSS)

数据集描述

RSS数据集是为语音合成设计的罗马尼亚语语音数据集。该数据集在爱丁堡大学的一个半消声室内录制,使用了三种高质量的录音设备,包括Neumann u89i、Sennheiser MKH 800和DPA 4035。当前版本仅包含通过Sennheiser MKH 800录制的语音数据。所有录音最初以96 kHz采样频率和24位每样本录制,后被下采样至48 kHz。数据集共进行了8次录音会话,每次约500句话。

语言

罗马尼亚语

数据集结构

  • 数据实例:每个数据点包括音频文件路径和对应的句子。
  • 数据字段
    • audio:包含音频文件路径、解码后的音频数组和采样率。
    • sentence:用户被提示说出的句子。
  • 数据分割:数据集被分为训练集和测试集。训练集包含3180个音频片段及其相关句子,测试集包含536个音频片段及其相关句子。

引用信息

@article{Stan2011442, title={The {R}omanian speech synthesis ({RSS}) corpus: Building a high quality {HMM}-based speech synthesis system using a high sampling rate}, author={Adriana Stan and Junichi Yamagishi and Simon King and Matthew Aylett}, journal={Speech Communication}, volume={53}, number={3}, pages={442--450}, year={2011}, doi={10.1016/j.specom.2010.12.002} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作