CVSS|语音翻译数据集|多语言处理数据集
收藏数据集概述
名称: CVSS (A Massively Multilingual Speech-to-Speech Translation Corpus)
描述: CVSS是一个大规模的多语言到英语的语音到语音翻译语料库,包含21种语言到英语的句子级平行语音到语音翻译对。该数据集源自Common Voice语音语料库和CoVoST 2语音到文本翻译语料库。翻译语音使用基于LibriTTS语料库训练的两个最先进的TTS模型合成。
版本:
- CVSS-C: 所有翻译语音使用单一规范发言人声音,具有高自然度和清洁度,以及一致的说话风格。
- CVSS-T: 翻译语音声音从相应源语音转移,每对翻译在不同语言中保持相似声音。
数据量: 每个版本包含约1,900小时的语音数据。
额外提供: 与翻译语音匹配的标准化翻译文本,用于模型训练和标准化评估。
数据获取
数据可通过以下链接下载,每个链接包含train, dev, test目录的音频剪辑和train.tsv, dev.tsv, test.tsv文件的标准化翻译文本。
许可证
CVSS数据集根据Creative Commons Attribution 4.0 International (CC BY 4.0)许可证发布。
引用
当引用CVSS语料库时,请使用以下引用信息:
@inproceedings{jia2022cvss, title={{CVSS} Corpus and Massively Multilingual Speech-to-Speech Translation}, author={Jia, Ye and Tadmor Ramanovich, Michelle and Wang, Quan and Zen, Heiga}, booktitle={Proceedings of Language Resources and Evaluation Conference (LREC)}, pages={6691--6703}, year={2022} }




