librispeech_lm
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/librispeech_lm
下载链接
链接失效反馈官方服务:
资源简介:
LibrispeechLm主要用于语言建模任务,它包含超过4000万条文本样本,总大小约为4.42GB。数据集中的每个样本都包含一个文本字段,但缺乏详细的标注信息。该数据集基于LibriSpeech ASR语料库,并提供标准的文本数据格式。使用者需要自行评估其潜在的社会影响和偏差。该数据集采用CC0 1.0许可协议。
创建时间:
2024-07-19



