AtharvA7k/ClArTTS
收藏Hugging Face2024-04-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/AtharvA7k/ClArTTS
下载链接
链接失效反馈官方服务:
资源简介:
ClArTTS数据集是一个用于支持阿拉伯语文本到语音(TTS)系统开发的语音语料库,特别是针对古典阿拉伯语。该数据集包含约12小时的单一男性说话者的语音,采样率为40100 kHz。语音数据来自LibriVox的有声读物,并经过处理、分段和手动转录。该数据集的目的是填补阿拉伯语TTS研究和开发中高质量语音语料库的空白,现有的阿拉伯语语音语料库大多不适合TTS训练,因为它们包含多说话者的非正式语音,且录音条件和质量存在差异。ClArTTS数据集旨在支持端到端TTS系统的开发,并提供与现有资源的比较。
ClArTTS数据集是一个用于支持阿拉伯语文本到语音(TTS)系统开发的语音语料库,特别是针对古典阿拉伯语。该数据集包含约12小时的单一男性说话者的语音,采样率为40100 kHz。语音数据来自LibriVox的有声读物,并经过处理、分段和手动转录。该数据集的目的是填补阿拉伯语TTS研究和开发中高质量语音语料库的空白,现有的阿拉伯语语音语料库大多不适合TTS训练,因为它们包含多说话者的非正式语音,且录音条件和质量存在差异。ClArTTS数据集旨在支持端到端TTS系统的开发,并提供与现有资源的比较。
提供机构:
AtharvA7k
原始信息汇总
数据集概述
数据集名称: ClArTTS
数据集描述: ClArTTS是一个用于支持古典阿拉伯语文本到语音转换系统开发的语音语料库。该语料库包含约12小时的单一男性演讲者语音,采样率为40100 kHz,从LibriVox有声读物中提取,经过处理、分割、手动转录和标注。
数据集特征
- 音频(audio):音频数据类型。
- 转录(transcription):字符串数据类型。
数据集分割
- 训练集(train):包含10000个样本,总大小为3567628186字节。
- 测试集(test):包含334个样本,总大小为119042383字节。
数据集大小
- 下载大小: 3467057358字节。
- 数据集总大小: 3686670569字节。
许可证
- 许可证: cc-by-4.0



