LibriLight
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/LibriLight
下载链接
链接失效反馈官方服务:
资源简介:
我们引入Libri-light,一个大型开源语料库 (60k小时) 的无标签语音和一组通用的度量来评估三个设置 :( 1) 零资源/无监督设置 (ABX),(2) 半监督设置 (PER和CER),(3) 远程监督设置 (WER)。最后两个设置使用资源有限的训练集 (10分钟,1小时,10小时),最后一个使用大的域内和域外文本来训练语言模型。
提供机构:
OpenDataLab
创建时间:
2023-04-20
搜集汇总
数据集介绍

背景与挑战
背景概述
LibriLight是一个大型开源语音语料库,包含约6万小时的无标签语音数据,旨在支持无监督、半监督和远程监督三种设置下的语音任务评估。该数据集由Facebook AI Research和PSL Research University于2019年发布。
以上内容由遇见数据集搜集并总结生成



