five

Multilingual Spoken Words Corpus

收藏
知名数据集2026-04-23 收录
下载链接:
https://mlcommons.org/en/multilingual-spoken-words/
下载链接
链接失效反馈
官方服务:
资源简介:
多语言口语语料库(Multilingual Spoken Words Corpus)是MLCommons机器学习联盟发布的大规模多语言音频数据集,包含50种语言的超过34万个关键词,总计2,340万个1秒口语示例(超过6,000小时)。该数据集主要用于关键词识别和口语词搜索的学术研究和商业应用,覆盖了全球超过50亿人口使用的语言,采用CC-BY 4.0许可证开放使用。
提供机构:
MLCommons机器学习联盟
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作