five

ESPnet-ST

收藏
arXiv2025-09-30 收录
下载链接:
https://espnet.github.io/espnet/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个专注于端到端语音到文本翻译的工具包,它采用了改进的跨注意力块。此外,本文中的模型是以预先训练的自动语音识别模型为基础进行初始化的。该数据集的任务是语音到文本神经机器翻译(S2T NMT)。

This dataset is a toolkit focused on end-to-end speech-to-text translation, which adopts improved cross-attention blocks. Additionally, the models in this paper are initialized based on pre-trained automatic speech recognition models. The task of this dataset is speech-to-text neural machine translation (S2T NMT).
提供机构:
National Institute of Advanced Industrial Science and Technology (AIST)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作