five

USM(Universal Speech Model)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/USM_Universal_Speech_Model
下载链接
链接失效反馈
官方服务:
资源简介:
通用语音模型 (USM) 是一系列最先进的语音模型,其 2B 参数经过 1200 万小时的语音和 280 亿条文本句子的训练,涵盖 300 多种语言。 USM 用于 YouTube(例如,隐藏式字幕),可以对广泛使用的语言(如英语和普通话)以及旁遮普语、阿萨姆语、桑塔利语、巴厘岛语、绍纳语、马达加斯加语等语言执行自动语音识别 (ASR), Luganda、Luo、Bambara、Soga、Maninka、Khosa、Akan、Lingala、Chichewa、Nkore、Nzema 等等。 其中一些语言只有不到 2000 万人使用,因此很难找到必要的训练数据。
提供机构:
OpenDataLab
创建时间:
2023-05-09
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作