TED-LIUM 3
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/TED-LIUM_3
下载链接
链接失效反馈官方服务:
资源简介:
"TED-LIUM 3 是从 TED Talks 收集的音频数据集。它包含:2351 个 NIST 球形格式 (SPH) 的音频演讲,包括来自 TED-LIUM 2 的演讲:小心,相同的演讲,但不同的音频文件(只有这些音频文件必须与 TED-LIUM 3 STM 文件一起使用) 452 小时的音频 2351 个 STM 格式的对齐自动成绩单 TEDLIUM 2 开发和测试数据:19 个 SPH 格式的 TED 演讲以及相应的手动成绩单(参见“遗留”分布如下)。带有发音的字典(159848 个条目),与包含在 TED-LIUM 2 中的文件相同的文件 从 WMT12 公开可用的语料库中选择用于语言建模的单语数据:这些文件来自 TED-LIUM 2 版本,但已被修改获得与英语更相关的标记化"
提供机构:
OpenDataLab
创建时间:
2022-05-09



