GigaST
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/GigaST
下载链接
链接失效反馈官方服务:
资源简介:
GigaST是一个大规模的语音翻译语料库,通过翻译GigaSpeech中的转录,GigaSpeech是一个具有10,000小时标记音频的多域英语语音识别语料库。培训数据由强大的机器翻译系统翻译,测试数据由专业的人工翻译产生。
提供机构:
OpenDataLab
创建时间:
2023-04-20
搜集汇总
数据集介绍

背景与挑战
背景概述
GigaST是一个大规模语音翻译语料库,通过翻译GigaSpeech中的转录构建,其中训练数据来自机器翻译系统,测试数据由专业人工翻译生成,由字节跳动人工智能实验室和南方科技大学于2022年发布。
以上内容由遇见数据集搜集并总结生成



