five

TED-LIUM 3

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/TED-LIUM_3
下载链接
链接失效反馈
官方服务:
资源简介:
"TED-LIUM 3 是从 TED Talks 收集的音频数据集。它包含:2351 个 NIST 球形格式 (SPH) 的音频演讲,包括来自 TED-LIUM 2 的演讲:小心,相同的演讲,但不同的音频文件(只有这些音频文件必须与 TED-LIUM 3 STM 文件一起使用) 452 小时的音频 2351 个 STM 格式的对齐自动成绩单 TEDLIUM 2 开发和测试数据:19 个 SPH 格式的 TED 演讲以及相应的手动成绩单(参见“遗留”分布如下)。带有发音的字典(159848 个条目),与包含在 TED-LIUM 2 中的文件相同的文件 从 WMT12 公开可用的语料库中选择用于语言建模的单语数据:这些文件来自 TED-LIUM 2 版本,但已被修改获得与英语更相关的标记化"
提供机构:
OpenDataLab
创建时间:
2022-05-09
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作