five

urdu-tts-corpus

收藏
Hugging Face2026-03-18 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/ahmedjaved812/urdu-tts-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
Urdu TTS Corpus 是一个精心整理的乌尔都语语音-文本配对数据集,专为训练文本到语音(TTS)和自动语音识别(ASR)模型而设计。该数据集将多个高质量来源整合为标准化的格式。数据集包含以下特征:hash_id(字符串)、text(字符串)、audio(音频,采样率为16,000 Hz)、duration_ms(整数)和src(字符串)。数据集分为训练集(train),包含122,477个样本,总大小为9,333,384,310字节。数据集适用于文本到语音和文本到音频任务,语言为乌尔都语(ur-PK),采样率为16,000 Hz,格式为Hugging Face数据集(音频+文本)。数据集合并了四个来源:gondal_urdu_tts、urdu_tts_16k、mozilla_cv_urdu_24和urdu_tts_fast。
创建时间:
2026-03-15
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作