huseinzol05/Malay-TTS-Osman

Name: huseinzol05/Malay-TTS-Osman
Creator: huseinzol05
Published: 2022-04-17 05:39:21
License: 暂无描述

Hugging Face2022-04-17 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/huseinzol05/Malay-TTS-Osman

下载链接

链接失效反馈

官方服务：

资源简介：

Malay-TTS-Osman数据集包含两个部分：Wiki and News和Parliament。Wiki and News部分包含24000样本率的超清洁音频，叙述者为ms-MY-OsmanNeural，时长约94.5小时，文本来自马来语维基百科和新闻，句子长度介于2至20个单词。Parliament部分同样具有24000样本率的超清洁音频，叙述者相同，时长约133.2小时，文本来自马来西亚马来语议会，句子长度介于2至25个单词。

提供机构：

huseinzol05

原始信息汇总

Malay-TTS-Osman 数据集概述

数据集属性

Wiki and News 部分

采样率: 24000 Hz
叙述者: ms-MY-OsmanNeural
总时长: 约94.5小时
文本来源: 马来语维基百科和新闻
句子长度: 2至20个单词

Parliament 部分

采样率: 24000 Hz
叙述者: ms-MY-OsmanNeural
总时长: 约133.2小时
文本来源: 马来西亚马来语议会
句子长度: 2至25个单词

数据集使用指南

Wiki and News 部分

下载文件:
- populated-text.json
- tts-malay-osman.tar.gz
获取音频和转录文本的方法: python import json import soundfile as sf

with open(populated-text.json) as fopen: texts = json.load(fopen)

index = 0 text = texts[index] y, sr = sf.read(fmale/{index}.wav)

Parliament 部分

下载文件:
- populated-parliament.json
- tts-malay-osman-parliament.tar.gz
获取音频和转录文本的方法: python import json import soundfile as sf

with open(populated-parliament.json) as fopen: texts = json.load(fopen)

index = 0 text = texts[index] y, sr = sf.read(fmale-parliament/{index}.wav)

5,000+

优质数据集

54 个

任务类型

进入经典数据集