five

VoxPopuli

收藏
arXiv2021-07-27 更新2024-06-21 收录
下载链接:
https://github.com/facebookresearch/voxpopuli
下载链接
链接失效反馈
资源简介:
VoxPopuli是由Facebook AI创建的大型多语种语音数据集,包含23种语言共计40万小时的未标记语音数据,是目前最大的开放数据集,用于无监督表示学习和半监督学习。该数据集还包含15种语言的1.8K小时转录演讲及其对15种目标语言的口头解释,总计17.3K小时。VoxPopuli旨在通过提供丰富的多语种音频数据,推动多语种自动语音识别(ASR)和语音翻译(ST)的研究进展,解决现有数据集在多语种支持上的不足,并特别关注实时语音翻译(解释)的质量与延迟平衡问题。
提供机构:
Facebook AI
创建时间:
2021-01-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作