TED-LIUM 英语语音识别训练语料库
收藏超神经2021-01-13 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/5048
下载链接
链接失效反馈官方服务:
资源简介:
TED-LIUM 是来自 TED 讲座的语音识别训练语料库,它带有转录,采样频率为 16kHz 的音频片段,合计包含大约 118 个小时的演讲。
TED-LIUM is a speech recognition training corpus derived from TED talks, comprising audio clips with a sampling rate of 16 kHz and their accompanying transcriptions, with a total duration of approximately 118 hours of speech.
创建时间:
2019-03-05
搜集汇总
数据集介绍

背景与挑战
背景概述
TED-LIUM是一个用于英语语音识别的训练语料库,源自TED讲座,包含约118小时的16kHz音频片段及对应转录。该数据集由缅因大学计算机科学实验室于2012年创建,大小为37.48 GB,适用于自然语言处理任务。
以上内容由遇见数据集搜集并总结生成



