USM（Universal Speech Model）

Name: USM（Universal Speech Model）
Creator: OpenDataLab
License: 暂无描述

OpenXLab2026-04-18 收录

下载链接：

https://openxlab.org.cn/datasets/OpenDataLab/USM_Universal_Speech_Model

下载链接

链接失效反馈

官方服务：

资源简介：

通用语音模型 (USM) 是一系列最先进的语音模型，其 2B 参数经过 1200 万小时的语音和 280 亿条文本句子的训练，涵盖 300 多种语言。 USM 用于 YouTube（例如，隐藏式字幕），可以对广泛使用的语言（如英语和普通话）以及旁遮普语、阿萨姆语、桑塔利语、巴厘岛语、绍纳语、马达加斯加语等语言执行自动语音识别 (ASR)， Luganda、Luo、Bambara、Soga、Maninka、Khosa、Akan、Lingala、Chichewa、Nkore、Nzema 等等。其中一些语言只有不到 2000 万人使用，因此很难找到必要的训练数据。

提供机构：

OpenDataLab

创建时间：

2023-05-09

5,000+

优质数据集

54 个

任务类型

进入经典数据集