USM(Universal Speech Model)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/USM_Universal_Speech_Model
下载链接
链接失效反馈官方服务:
资源简介:
通用语音模型 (USM) 是一系列最先进的语音模型,其 2B 参数经过 1200 万小时的语音和 280 亿条文本句子的训练,涵盖 300 多种语言。 USM 用于 YouTube(例如,隐藏式字幕),可以对广泛使用的语言(如英语和普通话)以及旁遮普语、阿萨姆语、桑塔利语、巴厘岛语、绍纳语、马达加斯加语等语言执行自动语音识别 (ASR), Luganda、Luo、Bambara、Soga、Maninka、Khosa、Akan、Lingala、Chichewa、Nkore、Nzema 等等。 其中一些语言只有不到 2000 万人使用,因此很难找到必要的训练数据。
提供机构:
OpenDataLab
创建时间:
2023-05-09



