OLR 2021
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/OLR_2021
下载链接
链接失效反馈官方服务:
资源简介:
由Speechocean,厦门大学和清华大学组织的OLR挑战系列旨在改善对多语言现象的研究并促进语言识别技术的发展。
● 涉及17种语言/方言,发布长达280小时的培训数据;
● 来自 “wild” 的数据被用作无约束LID任务中的测试数据集;
● 新增多语言语音识别任务;
● 排行榜中排名的实时更新;
快来加入吧!
The OLR Challenge series, organized by Speechocean, Xiamen University and Tsinghua University, aims to advance research on multilingual phenomena and promote the development of language identification technologies.
- Covering 17 languages and dialects, with up to 280 hours of training data released;
- Data sourced from "wild" scenarios is used as the test dataset for unconstrained LID tasks;
- A new multilingual speech recognition task has been added;
- Real-time ranking updates are provided on the leaderboard.
Come and join us!
提供机构:
OpenDataLab
创建时间:
2022-11-02
搜集汇总
数据集介绍

背景与挑战
背景概述
OLR 2021是一个由Speechocean、厦门大学和清华大学组织的语言识别挑战赛数据集,包含17种语言/方言的280小时训练数据,旨在促进多语言识别技术研究。该数据集于2021年发布,新增了多语言语音识别任务,并提供实时排行榜更新功能。
以上内容由遇见数据集搜集并总结生成



