thennal/indic_tts_ml

Name: thennal/indic_tts_ml
Creator: thennal
Published: 2022-12-08 20:23:33
License: 暂无描述

Hugging Face2022-12-08 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/thennal/indic_tts_ml

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是Indic TTS Malayalam Speech Corpus的一个子集，专门针对马拉雅拉姆语。数据集包含音频和文本两种类型的数据，以及性别信息。数据集分为训练集，包含8600个样本，总大小为4830182115.4字节。数据集主要用于文本到语音转换和自动语音识别任务。数据集中包含一个男性和一个女性的语音样本，但由于女性语音文件的缺失，样本比例为2:1。

提供机构：

thennal

原始信息汇总

数据集概述

数据集名称

Indic TTS Malayalam Speech Corpus

数据集特征

audio: 音频数据
text: 文本数据，类型为字符串
gender: 性别信息，类型为字符串

数据集分割

train:
- 示例数量: 8600
- 数据大小: 4830182115.4字节

数据集大小

下载大小: 3966895730字节
数据集总大小: 4830182115.4字节

语言

主要语言: Malayalam (ml)

任务类别

文本到语音转换 (text-to-speech)
自动语音识别 (automatic-speech-recognition)

数据集规模

规模类别: 1K<n<10K

5,000+

优质数据集

54 个

任务类型

进入经典数据集