five

OLR 2021

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/OLR_2021
下载链接
链接失效反馈
官方服务:
资源简介:
由Speechocean,厦门大学和清华大学组织的OLR挑战系列旨在改善对多语言现象的研究并促进语言识别技术的发展。 ● 涉及17种语言/方言,发布长达280小时的培训数据; ● 来自 “wild” 的数据被用作无约束LID任务中的测试数据集; ● 新增多语言语音识别任务; ● 排行榜中排名的实时更新; 快来加入吧!

The OLR Challenge series, organized by Speechocean, Xiamen University and Tsinghua University, aims to advance research on multilingual phenomena and promote the development of language identification technologies. - Covering 17 languages and dialects, with up to 280 hours of training data released; - Data sourced from "wild" scenarios is used as the test dataset for unconstrained LID tasks; - A new multilingual speech recognition task has been added; - Real-time ranking updates are provided on the leaderboard. Come and join us!
提供机构:
OpenDataLab
创建时间:
2022-11-02
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
OLR 2021是一个由Speechocean、厦门大学和清华大学组织的语言识别挑战赛数据集,包含17种语言/方言的280小时训练数据,旨在促进多语言识别技术研究。该数据集于2021年发布,新增了多语言语音识别任务,并提供实时排行榜更新功能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作