Multilingual Spoken Words Corpus
收藏知名数据集2026-04-23 收录
下载链接:
https://mlcommons.org/en/multilingual-spoken-words/
下载链接
链接失效反馈官方服务:
资源简介:
多语言口语语料库(Multilingual Spoken Words Corpus)是MLCommons机器学习联盟发布的大规模多语言音频数据集,包含50种语言的超过34万个关键词,总计2,340万个1秒口语示例(超过6,000小时)。该数据集主要用于关键词识别和口语词搜索的学术研究和商业应用,覆盖了全球超过50亿人口使用的语言,采用CC-BY 4.0许可证开放使用。
提供机构:
MLCommons机器学习联盟



